Участник:Anton/Песочница

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 16: Строка 16:
Рассмотрим модель со следующими ограничения:
Рассмотрим модель со следующими ограничения:
-
*Переменные <tex> x_p </tex> дискретны и принимают значения из множества {1,…,K}, K ≥ 2.
+
*переменные <tex> x_p </tex> дискретны и принимают значения из множества {1,…,K}, K ≥ 2,
-
*Система соседства E - прямоугольная решетка.
+
*система соседства E - прямоугольная решетка,
-
*Бинарные потенциалы V являются обобщенными потенциалами Поттса: <tex>V_{pq} = \alpha_{pq} [x_p \neq x_q] </tex>.
+
*бинарные потенциалы V являются обобщенными потенциалами Поттса: <tex>V_{pq} = \alpha_{pq} [x_p \neq x_q] </tex>.
-
В рамках этого задания требуется решить задачу поиска конфигурации MRF (значений переменных <tex> x_p </tex>), обладающей минимальной энергией.
+
В рамках этого задания требуется:
 +
#реализовать алгоритм поиска конфигурации MRF, обладающей минимальной энергией (TRW или α-expansion),
 +
#применить реализованный алгоритм для задачи интерактивной сегментации изображений.
-
== Вариант 1 ==
+
=== MRF для интерактивной сегментации изображений ===
 +
Задача сегментации изображения состоит в отнесении каждого пикселя изображения к одному из K классов. В интерактивном варианте пользователь отмечает часть пикселей, принадлежащих каждому классу. После этого требуется автоматически разметить оставшуюся часть изображения.
 +
Для задачи сегментации марковское случайное поле строится, например, так:
 +
*Каждая переменная <tex>x_p</tex> соответствует пикселю изображения.
 +
*Используется стандартная 4-х связная система соседства.
 +
*Если пиксель p отнесен пользователем к классу k, то унарные потенциалы "разрешают" переменной <tex>x_p</tex> принимать только значение k: <br><tex>D_p(k) = 0, D_p(l) = \infty, l \neq k</tex>.
 +
*Если пиксель p не отнесен пользователем ни к одному из классов, то унарные потенциалы принимают значения равные минус логарифму правдоподобия принадлежности пикселя цвета <tex> I_p </tex> соответствующему классу: <tex>D_p(k) = -\log P_k(I_p) </tex>.
 +
*Цветовые модели объектов можно восстановить по пикселям, размеченным пользователем, при помощи EM-алгоритма восстановления гауссовской смеси в пространстве Luv.
 +
 +
 +
 +
== Вариант 1 ==
-
=== Формулировка задания ===
+
=== Задание ===
=== Спецификация реализуемых функций ===
=== Спецификация реализуемых функций ===
Строка 37: Строка 50:
== Вариант 2 ==
== Вариант 2 ==
-
=== Формулировка задания ===
+
=== Задание ===
=== Спецификация реализуемых функций ===
=== Спецификация реализуемых функций ===

Версия 15:48, 7 апреля 2011

Статья в настоящий момент дорабатывается.
Формулировка задания находится в стадии формирования. Просьба не приступать к выполнению задания, пока это предупреждение не будет удалено. Anton 18:11, 7 апреля 2011 (MSD)


Содержание

Перейти к основной странице курса

Задание состоит из двух вариантов.

Среда реализации для всех вариантов – MATLAB. Неэффективная реализация кода может негативно отразиться на оценке.

Марковское случайное поле

Марковское случайное поле (MRF) — графическая модель, энергия (отрицательный логарифм правдоподобия) которой записывается в виде:
 
E(X) = \sum_{p \in P} D_p(x_p) + \sum_{(p, q) \in E} V_{pq}(x_p, x_q),
где P — множество индексов переменных, E — система соседства, D — унарные потенциалы, V — бинарные потенциалы.

Рассмотрим модель со следующими ограничения:

  • переменные  x_p дискретны и принимают значения из множества {1,…,K}, K ≥ 2,
  • система соседства E - прямоугольная решетка,
  • бинарные потенциалы V являются обобщенными потенциалами Поттса: V_{pq} = \alpha_{pq} [x_p \neq x_q] .

В рамках этого задания требуется:

  1. реализовать алгоритм поиска конфигурации MRF, обладающей минимальной энергией (TRW или α-expansion),
  2. применить реализованный алгоритм для задачи интерактивной сегментации изображений.

MRF для интерактивной сегментации изображений

Задача сегментации изображения состоит в отнесении каждого пикселя изображения к одному из K классов. В интерактивном варианте пользователь отмечает часть пикселей, принадлежащих каждому классу. После этого требуется автоматически разметить оставшуюся часть изображения.

Для задачи сегментации марковское случайное поле строится, например, так:

  • Каждая переменная x_p соответствует пикселю изображения.
  • Используется стандартная 4-х связная система соседства.
  • Если пиксель p отнесен пользователем к классу k, то унарные потенциалы "разрешают" переменной x_p принимать только значение k:
    D_p(k) = 0, D_p(l) = \infty, l \neq k.
  • Если пиксель p не отнесен пользователем ни к одному из классов, то унарные потенциалы принимают значения равные минус логарифму правдоподобия принадлежности пикселя цвета  I_p соответствующему классу: D_p(k) = -\log P_k(I_p) .
  • Цветовые модели объектов можно восстановить по пикселям, размеченным пользователем, при помощи EM-алгоритма восстановления гауссовской смеси в пространстве Luv.


Вариант 1

Задание

Спецификация реализуемых функций

Рекомендации по выполнению задания

Данные для выполнения задания

Оформление задания

Вариант 2

Задание

Спецификация реализуемых функций

Рекомендации по выполнению задания

Данные для выполнения задания

Оформление задания

Личные инструменты