Участник:Anton/Песочница
Материал из MachineLearning.
Строка 16: | Строка 16: | ||
Рассмотрим модель со следующими ограничения: | Рассмотрим модель со следующими ограничения: | ||
- | * | + | *переменные <tex> x_p </tex> дискретны и принимают значения из множества {1,…,K}, K ≥ 2, |
- | * | + | *система соседства E - прямоугольная решетка, |
- | * | + | *бинарные потенциалы V являются обобщенными потенциалами Поттса: <tex>V_{pq} = \alpha_{pq} [x_p \neq x_q] </tex>. |
- | В рамках этого задания требуется | + | В рамках этого задания требуется: |
+ | #реализовать алгоритм поиска конфигурации MRF, обладающей минимальной энергией (TRW или α-expansion), | ||
+ | #применить реализованный алгоритм для задачи интерактивной сегментации изображений. | ||
- | == | + | === MRF для интерактивной сегментации изображений === |
+ | Задача сегментации изображения состоит в отнесении каждого пикселя изображения к одному из K классов. В интерактивном варианте пользователь отмечает часть пикселей, принадлежащих каждому классу. После этого требуется автоматически разметить оставшуюся часть изображения. | ||
+ | Для задачи сегментации марковское случайное поле строится, например, так: | ||
+ | *Каждая переменная <tex>x_p</tex> соответствует пикселю изображения. | ||
+ | *Используется стандартная 4-х связная система соседства. | ||
+ | *Если пиксель p отнесен пользователем к классу k, то унарные потенциалы "разрешают" переменной <tex>x_p</tex> принимать только значение k: <br><tex>D_p(k) = 0, D_p(l) = \infty, l \neq k</tex>. | ||
+ | *Если пиксель p не отнесен пользователем ни к одному из классов, то унарные потенциалы принимают значения равные минус логарифму правдоподобия принадлежности пикселя цвета <tex> I_p </tex> соответствующему классу: <tex>D_p(k) = -\log P_k(I_p) </tex>. | ||
+ | *Цветовые модели объектов можно восстановить по пикселям, размеченным пользователем, при помощи EM-алгоритма восстановления гауссовской смеси в пространстве Luv. | ||
+ | |||
+ | |||
+ | |||
+ | == Вариант 1 == | ||
- | === | + | === Задание === |
=== Спецификация реализуемых функций === | === Спецификация реализуемых функций === | ||
Строка 37: | Строка 50: | ||
== Вариант 2 == | == Вариант 2 == | ||
- | === | + | === Задание === |
=== Спецификация реализуемых функций === | === Спецификация реализуемых функций === |
Версия 15:48, 7 апреля 2011
Статья в настоящий момент дорабатывается. Формулировка задания находится в стадии формирования. Просьба не приступать к выполнению задания, пока это предупреждение не будет удалено. Anton 18:11, 7 апреля 2011 (MSD) |
|
Перейти к основной странице курса
Задание состоит из двух вариантов.
Среда реализации для всех вариантов – MATLAB. Неэффективная реализация кода может негативно отразиться на оценке.
Марковское случайное поле
Марковское случайное поле (MRF) — графическая модель, энергия (отрицательный логарифм правдоподобия) которой записывается в виде:
где P — множество индексов переменных, E — система соседства, D — унарные потенциалы, V — бинарные потенциалы.
Рассмотрим модель со следующими ограничения:
- переменные дискретны и принимают значения из множества {1,…,K}, K ≥ 2,
- система соседства E - прямоугольная решетка,
- бинарные потенциалы V являются обобщенными потенциалами Поттса: .
В рамках этого задания требуется:
- реализовать алгоритм поиска конфигурации MRF, обладающей минимальной энергией (TRW или α-expansion),
- применить реализованный алгоритм для задачи интерактивной сегментации изображений.
MRF для интерактивной сегментации изображений
Задача сегментации изображения состоит в отнесении каждого пикселя изображения к одному из K классов. В интерактивном варианте пользователь отмечает часть пикселей, принадлежащих каждому классу. После этого требуется автоматически разметить оставшуюся часть изображения.
Для задачи сегментации марковское случайное поле строится, например, так:
- Каждая переменная соответствует пикселю изображения.
- Используется стандартная 4-х связная система соседства.
- Если пиксель p отнесен пользователем к классу k, то унарные потенциалы "разрешают" переменной принимать только значение k:
. - Если пиксель p не отнесен пользователем ни к одному из классов, то унарные потенциалы принимают значения равные минус логарифму правдоподобия принадлежности пикселя цвета соответствующему классу: .
- Цветовые модели объектов можно восстановить по пикселям, размеченным пользователем, при помощи EM-алгоритма восстановления гауссовской смеси в пространстве Luv.