Участник:Anton/Песочница
Материал из MachineLearning.
Строка 22: | Строка 22: | ||
В рамках этого задания требуется: | В рамках этого задания требуется: | ||
#реализовать алгоритм поиска конфигурации MRF, обладающей минимальной энергией (TRW или α-expansion), | #реализовать алгоритм поиска конфигурации MRF, обладающей минимальной энергией (TRW или α-expansion), | ||
- | #применить реализованный алгоритм для задачи интерактивной сегментации изображений. | + | #протестировать реализованный алгоритм на модельных задачах, |
+ | #применить реализованный алгоритм для задачи интерактивной сегментации изображений, | ||
+ | #сравнить алгоритмы TRW и α-expansion на задаче сегментации изображений. | ||
=== MRF для интерактивной сегментации изображений === | === MRF для интерактивной сегментации изображений === | ||
Строка 30: | Строка 32: | ||
*Каждая переменная <tex>x_p</tex> соответствует пикселю изображения. | *Каждая переменная <tex>x_p</tex> соответствует пикселю изображения. | ||
*Используется стандартная 4-х связная система соседства. | *Используется стандартная 4-х связная система соседства. | ||
- | *Если пиксель p отнесен пользователем к классу k, то унарные потенциалы | + | *Если пиксель p отнесен пользователем к классу k, то унарные потенциалы „разрешают“ переменной <tex>x_p</tex> принимать только значение k: <br><tex>D_p(k) = 0, D_p(l) = \infty, l \neq k</tex>. |
*Если пиксель p не отнесен пользователем ни к одному из классов, то унарные потенциалы принимают значения равные минус логарифму правдоподобия принадлежности пикселя цвета <tex> I_p </tex> соответствующему классу: <tex>D_p(k) = -\log P_k(I_p) </tex>. | *Если пиксель p не отнесен пользователем ни к одному из классов, то унарные потенциалы принимают значения равные минус логарифму правдоподобия принадлежности пикселя цвета <tex> I_p </tex> соответствующему классу: <tex>D_p(k) = -\log P_k(I_p) </tex>. | ||
- | *Цветовые модели объектов можно восстановить по пикселям, размеченным пользователем, при помощи EM-алгоритма восстановления | + | *Цветовые модели объектов можно восстановить по пикселям, размеченным пользователем, при помощи EM-алгоритма восстановления смеси нормальных распределений в пространстве Luv. |
+ | *В качестве парных потенциалов выбираются обобщенные потенциалы Поттса с коэффициентами α, делающими разрез более энергетически-выгодным, там где цвет изображения сильно меняется: <tex> \alpha_{pq} = A + B\:\exp\left(-\frac{\| I_p - I_q \|^2}{2\sigma^2}\right) </tex>, A ≥ 0, B ≥ 0, σ — параметры. | ||
- | + | == Вариант 1 : TRW== | |
- | == Вариант 1 == | + | |
=== Задание === | === Задание === | ||
Строка 48: | Строка 50: | ||
=== Оформление задания === | === Оформление задания === | ||
- | == Вариант 2 == | + | == Вариант 2 : α-expansion == |
=== Задание === | === Задание === |
Версия 16:13, 7 апреля 2011
Статья в настоящий момент дорабатывается. Формулировка задания находится в стадии формирования. Просьба не приступать к выполнению задания, пока это предупреждение не будет удалено. Anton 18:11, 7 апреля 2011 (MSD) |
|
Перейти к основной странице курса
Задание состоит из двух вариантов.
Среда реализации для всех вариантов – MATLAB. Неэффективная реализация кода может негативно отразиться на оценке.
Марковское случайное поле
Марковское случайное поле (MRF) — графическая модель, энергия (отрицательный логарифм правдоподобия) которой записывается в виде:
где P — множество индексов переменных, E — система соседства, D — унарные потенциалы, V — бинарные потенциалы.
Рассмотрим модель со следующими ограничения:
- переменные дискретны и принимают значения из множества {1,…,K}, K ≥ 2,
- система соседства E - прямоугольная решетка,
- бинарные потенциалы V являются обобщенными потенциалами Поттса: .
В рамках этого задания требуется:
- реализовать алгоритм поиска конфигурации MRF, обладающей минимальной энергией (TRW или α-expansion),
- протестировать реализованный алгоритм на модельных задачах,
- применить реализованный алгоритм для задачи интерактивной сегментации изображений,
- сравнить алгоритмы TRW и α-expansion на задаче сегментации изображений.
MRF для интерактивной сегментации изображений
Задача сегментации изображения состоит в отнесении каждого пикселя изображения к одному из K классов. В интерактивном варианте пользователь отмечает часть пикселей, принадлежащих каждому классу. После этого требуется автоматически разметить оставшуюся часть изображения.
Для задачи сегментации марковское случайное поле строится, например, так:
- Каждая переменная соответствует пикселю изображения.
- Используется стандартная 4-х связная система соседства.
- Если пиксель p отнесен пользователем к классу k, то унарные потенциалы „разрешают“ переменной принимать только значение k:
. - Если пиксель p не отнесен пользователем ни к одному из классов, то унарные потенциалы принимают значения равные минус логарифму правдоподобия принадлежности пикселя цвета соответствующему классу: .
- Цветовые модели объектов можно восстановить по пикселям, размеченным пользователем, при помощи EM-алгоритма восстановления смеси нормальных распределений в пространстве Luv.
- В качестве парных потенциалов выбираются обобщенные потенциалы Поттса с коэффициентами α, делающими разрез более энергетически-выгодным, там где цвет изображения сильно меняется: , A ≥ 0, B ≥ 0, σ — параметры.