Участник:Anton/Песочница
Материал из MachineLearning.
| Строка 16: | Строка 16: | ||
Рассмотрим модель со следующими ограничения: | Рассмотрим модель со следующими ограничения: | ||
| - | * | + | *переменные <tex> x_p </tex> дискретны и принимают значения из множества {1,…,K}, K ≥ 2, |
| - | * | + | *система соседства E - прямоугольная решетка, |
| - | * | + | *бинарные потенциалы V являются обобщенными потенциалами Поттса: <tex>V_{pq} = \alpha_{pq} [x_p \neq x_q] </tex>. |
| - | В рамках этого задания требуется | + | В рамках этого задания требуется: |
| + | #реализовать алгоритм поиска конфигурации MRF, обладающей минимальной энергией (TRW или α-expansion), | ||
| + | #применить реализованный алгоритм для задачи интерактивной сегментации изображений. | ||
| - | == | + | === MRF для интерактивной сегментации изображений === |
| + | Задача сегментации изображения состоит в отнесении каждого пикселя изображения к одному из K классов. В интерактивном варианте пользователь отмечает часть пикселей, принадлежащих каждому классу. После этого требуется автоматически разметить оставшуюся часть изображения. | ||
| + | Для задачи сегментации марковское случайное поле строится, например, так: | ||
| + | *Каждая переменная <tex>x_p</tex> соответствует пикселю изображения. | ||
| + | *Используется стандартная 4-х связная система соседства. | ||
| + | *Если пиксель p отнесен пользователем к классу k, то унарные потенциалы "разрешают" переменной <tex>x_p</tex> принимать только значение k: <br><tex>D_p(k) = 0, D_p(l) = \infty, l \neq k</tex>. | ||
| + | *Если пиксель p не отнесен пользователем ни к одному из классов, то унарные потенциалы принимают значения равные минус логарифму правдоподобия принадлежности пикселя цвета <tex> I_p </tex> соответствующему классу: <tex>D_p(k) = -\log P_k(I_p) </tex>. | ||
| + | *Цветовые модели объектов можно восстановить по пикселям, размеченным пользователем, при помощи EM-алгоритма восстановления гауссовской смеси в пространстве Luv. | ||
| + | |||
| + | |||
| + | |||
| + | == Вариант 1 == | ||
| - | === | + | === Задание === |
=== Спецификация реализуемых функций === | === Спецификация реализуемых функций === | ||
| Строка 37: | Строка 50: | ||
== Вариант 2 == | == Вариант 2 == | ||
| - | === | + | === Задание === |
=== Спецификация реализуемых функций === | === Спецификация реализуемых функций === | ||
Версия 15:48, 7 апреля 2011
| | Статья в настоящий момент дорабатывается. Формулировка задания находится в стадии формирования. Просьба не приступать к выполнению задания, пока это предупреждение не будет удалено. Anton 18:11, 7 апреля 2011 (MSD) |
|
Перейти к основной странице курса
Задание состоит из двух вариантов.
Среда реализации для всех вариантов – MATLAB. Неэффективная реализация кода может негативно отразиться на оценке.
Марковское случайное поле
Марковское случайное поле (MRF) — графическая модель, энергия (отрицательный логарифм правдоподобия) которой записывается в виде:
где P — множество индексов переменных, E — система соседства, D — унарные потенциалы, V — бинарные потенциалы.
Рассмотрим модель со следующими ограничения:
- переменные
дискретны и принимают значения из множества {1,…,K}, K ≥ 2,
- система соседства E - прямоугольная решетка,
- бинарные потенциалы V являются обобщенными потенциалами Поттса:
.
В рамках этого задания требуется:
- реализовать алгоритм поиска конфигурации MRF, обладающей минимальной энергией (TRW или α-expansion),
- применить реализованный алгоритм для задачи интерактивной сегментации изображений.
MRF для интерактивной сегментации изображений
Задача сегментации изображения состоит в отнесении каждого пикселя изображения к одному из K классов. В интерактивном варианте пользователь отмечает часть пикселей, принадлежащих каждому классу. После этого требуется автоматически разметить оставшуюся часть изображения.
Для задачи сегментации марковское случайное поле строится, например, так:
- Каждая переменная
соответствует пикселю изображения.
- Используется стандартная 4-х связная система соседства.
- Если пиксель p отнесен пользователем к классу k, то унарные потенциалы "разрешают" переменной
принимать только значение k:
.
- Если пиксель p не отнесен пользователем ни к одному из классов, то унарные потенциалы принимают значения равные минус логарифму правдоподобия принадлежности пикселя цвета
соответствующему классу:
.
- Цветовые модели объектов можно восстановить по пикселям, размеченным пользователем, при помощи EM-алгоритма восстановления гауссовской смеси в пространстве Luv.

