Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 874, осень 2013

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Семинар К.В. Рудакова, посвященный подготовке дипломных работ)
(Семинар К.В. Рудакова, посвященный подготовке дипломных работ)
Строка 32: Строка 32:
|-
|-
|Егор Будников
|Егор Будников
-
|
+
|Применение методов машинного обучения для решения задачи выделения именованных сущностей из текстов на естественном языке
-
|
+
|О.В. Красоткина
|
|
|-
|-

Версия 09:53, 8 апреля 2014


Семинар К.В. Рудакова, посвященный подготовке дипломных работ

Автор Название дипломной работы Научный руководитель Результат
Георгий Рудой Алгоритмы порождения экспертно-интерпретируемых моделей В.В. Стрижов
Михаил Кокшаров К.В. Воронцов
Александр Романенко Применение условных случайных полей в задачах обработки текстов на естественном языке К.В. Воронцов
Анастасия Мотренко Оценка объема выборки в задачах прогнозирования В.В. Стрижов
Егор Будников Применение методов машинного обучения для решения задачи выделения именованных сущностей из текстов на естественном языке О.В. Красоткина
Любовь Сандуляну Байесовский подход к построению одноклассового классификатора в задачах обнаружения текстовых заимствований и фильтрации нежелательной почты Ю.В. Чехович
Михаил Бурмистров
Александра Токмакова Выбор устойчивых прогностических моделей в задачах нелинейного регрессионного анализа В.В. Стрижов
Илья Ямщиков К.В. Воронцов

Эссе

В.В. Стрижов, экзамен

Автор 1 2 3 4 5 6 7 8 9 10, результат
Рудой 1[1] 2[2] 3[3] 4[4] 5[5] 6[6] 7[7] 8[8] 8 8
Кокшаров 1[9] 1 2[10] 2 3[11] 4[12] 5[13] 6[14] 7[15] 7
Романенко 1[16] 2[17] 3[18] 4[19] 5[20] 6[21] 7[22] 7 8[23] 9[24]
Мотренко 1[25] 2[26] 3[27] 4[28] 5[29] 6[30] 7[31] 8[32] 8 9[33]
Будников 1[34] 2[35] 3[36] 4[37] 5[38] 6[39] 7[40] 8[41] 8 8
Сандуляну 1[42] 2[43] 3[44] 4[45] 5[46] 6[47] 7[48] 8[49] 8 8
Бурмистров 1[50] 2[51] 3[52] 4[53] 5[54] 6[55] 7[56] 8[57] 9[58] 10[59]
Токмакова 1[60] 2[61] 3[62] 4[63] 5[64] 6[65] 7[66] 8[67] 8 8
Ямщиков 1[68] 1 2[69] 2 3[70] 4[71] 5[72] 6[73] 7[74] 8[75]

Список тем

  1. Аппроксимация множества точек замкнутыми кривыми
  2. Метод группового учета аргументов в краткой нотации
  3. Заполнение пропусков в порядковых шкалах (и в шкалах без отношения полного порядка)
  4. Роль Матрицы Ганкеля в прогнозировании временных рядов
  5. Интегральные индикаторы в ранговых шкалах
  6. Порождение признаков в прикладных задачах анализа данных
  7. Смеси моделей, многоуровневые модели, смеси экспертов
  8. Отыскание общих узлов в последовательности наборов метрических конфигураций
  9. Регрессионный анализ задачах математического моделирования. Найти пример использования регрессионного анализа в тех задачах математического моделирования в физике, химии, биологии, и т.д., где требуется получить модель, интерпретируемую в терминах предметной области
  10. Машинное обучение через 20 лет: какими методами АД (МО, ИИ, ЭС, АЗ,...) мы будем пользоваться? Какие задачи мы будет решать? Что я буду делать в своей профессиональной области?
Лекции/доклады студентов ==

К.В. Рудаков, семинар

Тема Автор Ссылка Дата Результат Сумма
Data Analysis Problem Statements in the Category Theory Language Рудой [76] 24 сентября NIR(3)+OK(5)+1/4 * [(0/GR)+(8/10)+(8/10AM)+(8/10AR)+(9/10)+(4.5/5)+(10/10)+(4.5/5)+(9/10)] 9.75
Machine Learning Problem Statements in Plate Notations Кокшаров [77] 24 сентября NIR(3)+OK(5)+1/4 * [(8/GR)+(0/MK)+(0/AM)+(0/AR)+(8/10)+(4.5/5)+(9/10)+(4/5)+(10/10)] 9
Deep Learning / Methods for Big Data Романенко [78] 1 октября NIR(3)+OK(5)+1/4 * [(9/10GR)+(9/10)+(7/10)+(0/AR)+(9/10)+(4/5)+(10/10)+(4.5/5)+(9/10)] 9
Usage of Copulas Мотренко [79] 1 октября NIR(3)+OK(5)+1/4 * [(10/10GR)+(9/10)+(0/AM)+(8/10)+(6/10)+(5/5)+(9/10)+(4.5/5)+(10/10)] 9,9
Problems of Voting, Expert Systems and Preference Learning Будников [80] 8 октября NIR(3)+OK(5)+1/4 * [(8/10)+(7/10)+(8/10)+(7/10)+(8/10)+(0/YB)+(10/10)+(4.5/5)+(7/10)] 9.6
Topic Modeling: PLSA, LDA et al. Сандуляну [81] 8 октября NIR(3)+OK(5)+1/4 * [(7/10)+(6/10)+(7/10)+(8/10)+(0/LS)+(3.5/5)+(9/10)+(4.5/5)+(10/10)] 9
MDL Principle Бурмистров [82] 15 октября NIR(3)+OK(5)+1/4 * [(0/10)+(0/10)+(8/10)+(7/10)+(10/10)+(4/5)+(0/MB)+(4/5)+(10/10)] 9.275
Data and Parameter Sampling and Applications Токмакова [83] 15 октября NIR(3)+OK(5)+1/4 * [(9/10)+(6/10)+(8/10)+(6/10)+(9/10)+(5/5)+(10/10)+(0/AT)+(10/10)] 9
Learning of games / Многорукие бандиты Ямщиков [84] 22 октября NIR(3)+OK(5) +1/4 * [(8/10)+(10/10)+(0/AM)+(0/AR)+(9/10)+(5/5)+(10/10)+(5/5)+(0/IY)] 9.425
Mixture of Experts (and Models) Адуенко [85] 29 октября (приглашенный лектор)

Дополнительно

  • Метрические вложения
  • Теория статистического обучения

Требования: Продолжительность: 1 академический час, 45 минут. Число слайдов: 20-30 (по вкусу).

  1. Раскрыть проблему постановки задачи Машинного обучения и анализа данных в данной теме
  2. Подобрать примеры постановки (и решения) известных (а может и узкоспециальных) задач

Рекомендации к стилю изложения:

  1. дать основные определения этой области
  2. привести теоретические примеры и основные свойства
  3. представить математические методы,
  4. дать теоретические постановки задач,
  5. привести приметы прикладных задач.

Оценки: макс. 7 баллов из 10 (5 за лекцию + 2 за тесты). Тест: готовит лектор, 5 вопросов со свободным ответом и вопрос «Основное сообщение лекции (2-3 предложения)». Результат теста: N из 5 (отображается в 1/4). 17 декабря – отчеты о научной работе.

Практика

А.А. Ивахненко: практика

Внешняя ссылка на технологическую карту проекта (редактирование возможно по доступу).

Домашнее задание S1.

  1. Постановка задачи и математическое описание алгоритма в файле Surname2013Title.tex и pdf (подумать над синтетическими данными).
  2. Описание интерфейса в общем файле Systemdocs:
    1. Литература: каждый добавляет свои ссылки на статьи с основным алгоритмом.
    2. Свой блок в общем файле IDEF0 (вSystemdocs пока не вставлять).
    3. Егор: Общее описание алгоритма.

Домашнее задание S2.

  1. Написать код, работающий на синтетических данных, доработать постановку задачи
  2. Технологии:
    1. Егор: дописать IDEF, описание проекта, интерфейс
    2. Илья: прочитать доклад о юнит-тестировании
    3. Александра: проверить тестовые данные и согласовать их постановкой задач
    4. Любовь: проверить постановки задач и описания алгоритмов (те, которые будут готовы)

Технологам нужно заполнить проверенные работы в таблице.

Домашнее задание S3.

  1. Написать юнит-тесты для кода, попытаться запустить алгоритм на реальных данных.
  2. Технологии:
    1. Любовь: утвердить все постановки задач, сшить постановки в общую статью (используя jmlda.sty)
    2. Георгий: проверить стиль кода, сделать замечания, предложить удобные обозначения переменных, согласованные с постановками задач
    3. Егор: проверить и утвердить IDEF0, описания данных и интерфейсов.
    4. Илья: проверить и утвердить юнит-тесты

Домашнее задание S4.

  1. Написать системные тесты, отпрофилировать, нарисовать картинки, написать комментарии.
  2. Технологии:
    1. Все - картинки с использованием географической карты (и других изображений - карты высот и карты SAR) с результатами и пояснениями для отчета
    2. Михаил Б.: список работающих тестов systemdocs
    3. Анастасия: Проверить результаты визуализации - содержимое и оформление, утвердить
    4. Александр: список историй успеха о профилировании, утвердить
    5. Егор: запуск системы, завершение systemdocs
    6. Михаил К.: отчет по разделам с картинками, часть systemdocs

А.А. Ивахненко: тест/экзамен

  • Токмакова -0,5 (3)
  • Бурмистров -2,5 (2)
  • Будников -1 (3)
  • Романенко -1,5 (2)
  • Ямщиков -0,5 (3)
  • Мотренко -3 (2)
  • Рудой -4,5 (1)
  • Кокшаров -6,5 (0,5)
  • Сандуляну -1,5 (2)

Минус баллы - это сколько было допущено ошибок. Дробные баллы за ошибки в неоднозначных вопросах или за достойные аргументы в поддержку своего ответа. Критерии (-1,5; 0] = 3, (-4; -1,5] = 2, (-inf; -4] = 1 с уменьшением по мере приближения к -inf.


Результаты

Автор S1 S2 S3 S4 Технолог Система Доклад Итог по проекту Сумма по курсу
Рудой 0 1 1 0 1 1 - 5 6
Кокшаров - - - - - 0 - 0*7 6.5
Романенко 1 1 1 1 1 1 - 7 9
Мотренко 1 1 1 1 1 1 - 7 9
Будников 1 1 1 1 1 1 - 7 10
Сандуляну 1 1 1 1 1 1 - 7 9
Бурмистров 1 1 1 1 1 1 - 7 9
Токмакова 1 1 1 1 1 1 - 7 10
Ямщиков 1 1 1 1 1 1 - 7 10
Личные инструменты