Графические модели (курс лекций)/2012/Задание 6

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (Задание)
м
Строка 84: Строка 84:
Присланный вариант задания должен содержать в себе:
Присланный вариант задания должен содержать в себе:
-
* ФИО исполнителя, номер группы и номер варианта задания.
 
* Текстовый файл в формате PDF, содержащий описание проведенных исследований.
* Текстовый файл в формате PDF, содержащий описание проведенных исследований.
* Все исходные коды с необходимыми комментариями.
* Все исходные коды с необходимыми комментариями.
Строка 120: Строка 119:
|D — значения стандартных отклонений энергии на один спин <tex>\frac{1}{N}\sqrt{\mathbb{D}E}</tex> для каждой температуры, массив размера 1 x <tex>\beta_0</tex>;
|D — значения стандартных отклонений энергии на один спин <tex>\frac{1}{N}\sqrt{\mathbb{D}E}</tex> для каждой температуры, массив размера 1 x <tex>\beta_0</tex>;
|-
|-
-
|M — значения средней магнетизации на один спин <tex>\mathbb{E}\mu^2</tex> для каждой температуры, массив размера 1 x <tex>\beta_0</tex>;
+
|M — значения средней магнетизации на один спин <tex>\sqrt{\mathbb{E}\mu^2}</tex> для каждой температуры, массив размера 1 x <tex>\beta_0</tex>;
|-
|-
|S — примеры конфигураций <tex>X</tex> для всех температур, массив размера vS x hS x <tex>\beta_0</tex>.
|S — примеры конфигураций <tex>X</tex> для всех температур, массив размера vS x hS x <tex>\beta_0</tex>.
Строка 199: Строка 198:
Присланный вариант задания должен содержать в себе:
Присланный вариант задания должен содержать в себе:
-
* ФИО исполнителя, номер группы и номер варианта задания.
 
* Текстовый файл в формате PDF, содержащий описание проведенных исследований.
* Текстовый файл в формате PDF, содержащий описание проведенных исследований.
* Все исходные коды с необходимыми комментариями.
* Все исходные коды с необходимыми комментариями.

Версия 14:45, 3 мая 2012

Содержание

Начало выполнения задания: 2 мая 2012 г.
Срок сдачи: 23 мая 2012 г. (среда), 23:59.

Задание состоит из двух вариантов. Распределение вариантов задания по студентам:

Вариант 1 Вариант 2
Бобрик К. Ермушева А.
Кириллов А. Фигурнов М.
Сабурова М. Зимовнов А.
Некрасов К. Елшин Д.
Шанин И. Артюхин С.
Матвеева Д. Гаврилюк К.
Соколов Е. Новиков П.
Меркулова Т. Полежаев В.
Алексадров Я. Марченко Е.
Плященко Е. Цупков С.
Игнатьев О. Панов А.

Модель Изинга

Прямоугольная система соседства
Прямоугольная система соседства
Треугольная система соседства
Треугольная система соседства

Модель Изинга — математическая модель статистической физики, предназначенная для описания магнитных свойств вещества. Каждой вершине кристаллической решётки (рассматривается двухмерный случай) сопоставляется число, называемое спином и равное +1 или −1 («поле вверх»/«поле вниз»). Каждому из 2^N возможных вариантов расположения спинов (где N — число атомов решётки) приписывается энергия, состоящая из взаимодействия спинов соседних атомов J и действия внешнего магнитного поля H:
 
E(X) = -\left( \frac{J}{2} \sum_{(i,j) \in\mathcal{E}} x_i x_j + \sum_{i=1}^N H_i x_i \right),
где x_i — переменные, соответствующие спинам, \mathcal{E{ — система соседства (в данном задании рассматриваются две системы соседства: прямоугольная и треугольная). Пара (i,j)\in\mathcal{E} не является упорядоченной. Вероятность нахождения в каждом конкретном состоянии задается распределением Гиббса:

P(X) = \frac{1}{Z} \exp{\left( -\beta E(X) \right)}, \qquad \beta = \frac{1}{kT},
где Z — нормировочная константа, T — температура, k — параметр.

Если J = 1 , то вещество называется ферромагнетиком. Если J = -1, то вещество называется антиферромагнетиком.

Вариант 1

Описание задания

Провести исследование модели Изинга методом Монте-Карло по схеме Гиббса. В этой схеме генерация значения очередного элемента решетки x_i производится по следующим формулам:

p(x_i = 1 | X_{/\{i\}}) = \frac{1}{1 + \exp(-2\beta b_i)}, \qquad b_i = J\sum_{j: (i, j) \in\mathcal{E}} x_j + H_i,

p(x_i = -1 | X_{/\{i\}}) = \frac{\exp(-2\beta b_i)}{1 + \exp(-2\beta b_i)}.

Задание

Пример иллюстрации состояния модели Изинга размера 20 на 20.
Пример иллюстрации состояния модели Изинга размера 20 на 20.
  1. Вывести формулы генерации выборки по схеме Гиббса из модели Изинга (вывод вставить в отчет).
  2. Реализовать процедуру подсчета математического ожидания и дисперсии энергии (нормированной на количество спинов N), математического ожидания квадрата общей намагниченности модели \mu = \left(\sum_{i=1}^N x_i \right) / N методом Гиббса (с заданным числом итераций) для заданных параметров \beta и внешнего магнитного поля H. Требования по эффективности реализации: 1000 итераций метода Гиббса для решетки размера 20 на 20 и ста значений параметра \beta должны выполняться не более 20 секунд. В отчете привести соответствующие замеры времени работы кода.
  3. Построить графики зависимости \frac{1}{N}\mathbb{E}E, \frac{1}{N}\sqrt{\mathbb{D}E}, \sqrt{\mathbb{E}(\mu^2)} от температуры для треугольной и четырехугольной систем соседства, ферромагнетика и антиферромагнетика (всего 4 модели). Проинтерпретировать полученные результаты (в частности идентифицировать, локализовать и изучить фазовый переход). Для построения графиков использовать следующие значения параметров:
    • размер решетки 20 на 20 (N = 400);
    • k = 1;
    • 10000 итераций метода Гиббса для оценки статистик;
    • для ферромагнетика J = 1, для антиферромагнетика J = -1;
    • внешнее магнитное поле H_i = 0;
    • температуры T = 0.5 : 0.1 : 10.
  4. Для ферромагнетика с четырехугольной системой связности отобразить характерные отдельные конфигурации X (см. рис.) в зависимости от температуры (низкая температура, окрестность фазового перехода, высокая температура). Проинтерпретировать результаты. Рассмотреть как минимум по одному примеру для не менее, чем пяти разных значений температур. Параметры генерации те же, что и в пункте 3.
  5. Исследовать влияние константного внешнего магнитного поля на фазовый переход в ферромагнетике с прямоугольной системой соседства. Привести соответствующие графики. Параметры модели взять такие же, как в пункте 3.
  6. Выполнить пункт 4 в присутствии внешнего магнитного поля со следующей структурой: на половине решетки H = 1, на другой половине H = -1.
  7. Сравнить результаты метода Монте-Карло с результатами вариационного подхода. Рассмотреть ферромагнетик с прямоугольной системой соседства. Реализацию вариационного подхода взять у товарища, выполняющего вариант 2 (в отчете указать, чей код вы используете). Привести графики математического ожидания и дисперсии энергии, корня из математического ожидания квадрата намагниченности в одних осях для двух подходов.

Оформление задания

Выполненное задание следует отправить письмом по адресу bayesml@gmail.com с заголовком письма «Задание 6 <ФИО>». Убедительная просьба присылать выполненное задание только один раз с окончательным вариантом. Новые версии будут рассматриваться только в самом крайнем случае. Также большая просьба строго следовать указанным ниже прототипам реализуемых функций.

Программная среда для выполнения задания — MATLAB.

Присланный вариант задания должен содержать в себе:

  • Текстовый файл в формате PDF, содержащий описание проведенных исследований.
  • Все исходные коды с необходимыми комментариями.
  • Дополнительные комментарии или материалы, если необходимо.

Исходные коды должны включать в себя реализацию метода Гиббса для прямоугольной и треугольной систем соседств в виде отдельных функций (отдельных m-файлов). Прототипы функций имеют следующий вид:

Метод Гиббса для оценки статистик распределений
[E, D, M, S] = gibbsIsing4(H, J, betaAll, num_iter) — прямоугольная система соседства
[E, D, M, S] = gibbsIsing6(H, J, betaAll, num_iter) — треугольная система соседства
ВХОД
H — внешнее магнитное поле, матрица типа double размера vS x hS;
J — параметр модели J;
betaAll — вектор значений параметра \beta (в MatLab матрица типа double размера 1 x \beta_0);
num_iter — количество итераций схемы Гиббса;
ВЫХОД
E — значения мат.ожиданий энергии на один спин \frac{1}{N}\mathbb{E}E для каждой температуры, массив размера 1 x \beta_0;
D — значения стандартных отклонений энергии на один спин \frac{1}{N}\sqrt{\mathbb{D}E} для каждой температуры, массив размера 1 x \beta_0;
M — значения средней магнетизации на один спин \sqrt{\mathbb{E}\mu^2} для каждой температуры, массив размера 1 x \beta_0;
S — примеры конфигураций X для всех температур, массив размера vS x hS x \beta_0.

Рекомендации

  • Рекомендуется реализовывать метод Гиббса с векторными операциями по параметру \beta, т.е. проводить вычисления для всех температур сразу.
  • Для оценки статистик распределения следует отбрасывать значения, полученные на первой трети итераций метода Гиббса.
  • В качестве примеров конфигураций X лучше брать ситуации с последних итераций схемы Гиббса.
  • На этапе тестирования функций рекомендуется проводить эксперименты со случайным внешним магнитным полем H.
  • Одной из возможных проверок на корректность оценки статистик по сгенерированному набору конфигураций X является следующая: сделать большое число итераций по схеме Гиббса, рассмотреть несколько различных подмножеств сгенерированных конфигураций, по каждому из подмножеств оценить статистики. При правильной реализации статистики, оцененные по разным подмножествам конфигураций, должны быть близки между собой.

Вариант 2

Описание задания

Провести исследование модели Изинга с помощью вариационного подхода, где в качестве факторизованного семейства для q(X) выступает независимое распределение по всем компонентам x_i:

q(X)=\prod_{i=1}^Nq_i(x_i).

Необходимые формулы пересчета для вариационного подхода:

b_i = H_i + J\sum_{j:(i,j) \in\mathcal{E}}\mathbb{E}x_j,

q_i(x_i = 1) = \frac{1}{1 + \exp(-2\beta b_i)},

\mathbb{E}x_i = 2q_i(x_i=1)-1.

При этом нижняя граница на значение логарифма нормировочной константы \log Z равна

\mathcal{L}(q) = \beta\left(\sum_{i=1}^NH_i\mathbb{E}x_i + \frac{J}{2}\sum_{(i,j)\in\mathcal{E}}\mathbb{E}x_i\mathbb{E}x_j\right) - \sum_{i=1}^N\left[q_i(x_i=1)\log(q_i(x_i=1)) + (1-q_i(x_i=1))\log(1-q_i(x_i=1))\right].

Необходимые статистики для приближенного распределения q(X) вычисляются следующим образом:

\frac{1}{N}\mathbb{E}E = -\frac{1}{N}\left(\sum_{i=1}^NH_i\mathbb{E}x_i + \frac{J}{2}\sum_{(i,j)\in \mathcal{E}}\mathbb{E}x_i\mathbb{E}x_j\right),

\mathbb{E}E^2 = \sum_{i,j=1}^NH_iH_j\mathbb{E}(x_ix_j) + J\sum_{n,(i,j)\in \mathcal{E}}H_n\mathbb{E}(x_nx_ix_j) + \frac{J^2}{4}\sum_{(i,j)\in\mathcal{E}, (n,m)\in\mathcal{E}}\mathbb{E}(x_ix_jx_nx_m),

\mathbb{D}E = \mathbb{E}E^2 - (\mathbb{E}E)^2,

\mathbb{E}\left(\sum_{i=1}^Nx_i\right)^2 = \sum_{i,j=1}^N\mathbb{E}(x_ix_j),

\mathbb{E}x_ix_j = \mathbb{E}x_i\mathbb{E}x_j,\ i\neq j;\ \mathbb{E}x_i^2 = 1.

Задание

  1. Вывести все необходимые формулы для вариационного подхода (вывод вставить в отчет).
  2. Реализовать процедуру подсчета математического ожидания и дисперсии энергии (нормированной на количество спинов N), математического ожидания квадрата общей намагниченности модели \mu = \left(\sum_{i=1}^N x_i \right) / N с помощью вариационного подхода для заданных параметров \beta и внешнего магнитного поля H. Требования по эффективности реализации: для решетки размера 20 x 20 сто итераций поиска вариационного приближения для ста значений параметра \beta должны выполнятся не более одной секунды, включая этап оценки всех статистик. В отчете привести соответствующие замеры времени работы кода.
  3. Построить графики зависимости \frac{1}{N}\mathbb{E}E, \frac{1}{N}\sqrt{\mathbb{D}E}, \sqrt{\mathbb{E}(\mu^2)}, \mathcal{L}(q) от температуры для треугольной и четырехугольной систем соседства, ферромагнетика и антиферромагнетика (всего 4 модели). Проинтерпретировать полученные результаты (в частности идентифицировать, локализовать и изучить фазовый переход). Для построения графиков использовать следующие значения параметров:
    • размер решетки 20 на 20 (N = 400);
    • k = 1;
    • для ферромагнетика J = 1, для антиферромагнетика J = -1;
    • внешнее магнитное поле H_i = 0;
    • температуры T = 0.5 : 0.1 : 10;
    • количество итераций = 300;
    • точность по значению нижней границы \mathcal{L}(q) = 10^{-4} (останавливаем итерационный процесс, если значение \mathcal{L}(q) на текущей итерации изменилось меньше, чем на 10^{-4}).
  4. Для ферромагнетика с четырехугольной системой связности отобразить найденное распределение q (в шкале серого) в зависимости от температуры (низкая температура, окрестность фазового перехода, высокая температура). Проинтерпретировать результаты. Рассмотреть результаты для не менее, чем пяти разных значений температур. Параметры генерации те же, что и в пункте 3.
  5. Исследовать влияние константного внешнего магнитного поля на фазовый переход в ферромагнетике с прямоугольной системой соседства. Привести соответствующие графики. Параметры модели взять такие же, как в пункте 3.
  6. Выполнить пункт 4 в присутствии внешнего магнитного поля со следующей структурой: на половине решетки H = 1, на другой половине H = -1.
  7. Сравнить результаты применения вариационного подхода с аналогичными для схемы Гиббса. Рассмотреть ферромагнетик с прямоугольной системой соседства. Реализацию схемы Гиббса взять у товарища, выполняющего вариант 1 (в отчете указать, чей код вы используете). Привести графики математического ожидания и дисперсии энергии, корня из математического ожидания намагниченности в одних осях для двух подходов.

Оформление задания

Выполненное задание следует отправить письмом по адресу bayesml@gmail.com с заголовком письма «Задание 6 <ФИО>». Убедительная просьба присылать выполненное задание только один раз с окончательным вариантом. Новые версии будут рассматриваться только в самом крайнем случае. Также большая просьба строго следовать указанным ниже прототипам реализуемых функций.

Программная среда для выполнения задания — MATLAB.

Присланный вариант задания должен содержать в себе:

  • Текстовый файл в формате PDF, содержащий описание проведенных исследований.
  • Все исходные коды с необходимыми комментариями.
  • Дополнительные комментарии или материалы, если необходимо.

Исходные коды должны включать в себя реализацию вариационного подхода для прямоугольной и треугольной систем соседств в виде отдельных функций (отдельных m-файлов). Прототипы функций имеют следующий вид:

Вариационный подход
[E, D, M, L] = varIsing4(H, J, betaAll, opt_params) — прямоугольная система соседства
[E, D, M, L] = varIsing6(H, J, betaAll, opt_params) — треугольная система соседства
ВХОД
H — внешнее магнитное поле, матрица размера vS x hS;
J — параметр модели J;
betaAll — вектор значений параметра \beta (в MatLab матрица размера 1 x \beta_0);
opt_params — (необязательный параметр) параметры оптимизационного процесса, структура со следующими полями:
'max_iter' — максимальное количество итераций, по умолчанию = 300;
'tol_crit' — необходимая точность по значению нижней границы, по умолчанию = 10^{-4};
'num_start' — количество различных начальных приближений, по умолчанию = 1;
ВЫХОД
E — мат.ожидание энергии на один спин \frac{1}{N}\mathbb{E}E для каждой температуры, массив размера 1 x \beta_0;
D — стандартное отклонение энергии на один спин \frac{1}{N}\sqrt{\mathbb{D}E} для каждой температуры, массив размера 1 x \beta_0;
M — средняя магнетизация \sqrt{\mathbb{E}\mu^2} для каждой температуры, массив размера 1 x \beta_0;
L — нижние границы для логарифмов нормировочных констант для каждой температуры, массив размера 1 x \beta_0.

Рекомендации

  • Рекомендуется реализовывать метод с векторными операциями по параметру \beta, т.е. проводить вычисления для всех температур сразу.
  • Рекомендуется запускать вариационную оптимизацию из нескольких начальных приближений для q: случайные, все вероятности одинаковые и близки к единице, шахматная доска и т.д. При этом для текущей температуры наилучшим вариационным приближением признается такое, при котором значение нижней границы \mathcal{L}(q) является максимальным.
  • Одной из проверок на корректность оптимизации в рамках вариационного подхода является монотонное возрастание значения нижней границы \mathcal{L}(q).
  • На этапе тестирования функций рекомендуется проводить эксперименты со случайным внешним магнитным полем H.
  • Одной из возможных проверок на корректность вычисления различных статистик по приближению q является использование метода Монте Карло, при котором генерируется набор конфигураций X^j (каждая конфигурация состоит из независимых спинов x_i^j), по которым затем оцениваются необходимые статистики.
Личные инструменты