Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 874, осень 2013

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Семинар К.В. Рудакова, посвященный подготовке дипломных работ)
Строка 27: Строка 27:
|-
|-
|Анаставия Мотренко
|Анаставия Мотренко
-
|
+
|Оценка объема выборки в задачах прогнозирования
|В.В. Стрижов
|В.В. Стрижов
|
|
Строка 57: Строка 57:
|-
|-
|}
|}
-
 
== Эссе ==
== Эссе ==

Версия 15:48, 7 марта 2014


Семинар К.В. Рудакова, посвященный подготовке дипломных работ

Автор Название дипломной работы Научный руководитель Результат
Георгий Рудой В.В. Стрижов
Михаил Кокшаров К.В. Воронцов
Александр Романенко К.В. Воронцов
Анаставия Мотренко Оценка объема выборки в задачах прогнозирования В.В. Стрижов
Егор Будников
Любовь Сандуляну Ю.В. Чехович
Михаил Бурмистров
Александра Токмакова В.В. Стрижов
Илья Ямщиков К.В. Воронцов

Эссе

В.В. Стрижов, экзамен

Автор 1 2 3 4 5 6 7 8 9 10, результат
Рудой 1[1] 2[2] 3[3] 4[4] 5[5] 6[6] 7[7] 8[8] 8 8
Кокшаров 1[9] 1 2[10] 2 3[11] 4[12] 5[13] 6[14] 7[15] 7
Романенко 1[16] 2[17] 3[18] 4[19] 5[20] 6[21] 7[22] 7 8[23] 9[24]
Мотренко 1[25] 2[26] 3[27] 4[28] 5[29] 6[30] 7[31] 8[32] 8 9[33]
Будников 1[34] 2[35] 3[36] 4[37] 5[38] 6[39] 7[40] 8[41] 8 8
Сандуляну 1[42] 2[43] 3[44] 4[45] 5[46] 6[47] 7[48] 8[49] 8 8
Бурмистров 1[50] 2[51] 3[52] 4[53] 5[54] 6[55] 7[56] 8[57] 9[58] 10[59]
Токмакова 1[60] 2[61] 3[62] 4[63] 5[64] 6[65] 7[66] 8[67] 8 8
Ямщиков 1[68] 1 2[69] 2 3[70] 4[71] 5[72] 6[73] 7[74] 8[75]

Список тем

  1. Аппроксимация множества точек замкнутыми кривыми
  2. Метод группового учета аргументов в краткой нотации
  3. Заполнение пропусков в порядковых шкалах (и в шкалах без отношения полного порядка)
  4. Роль Матрицы Ганкеля в прогнозировании временных рядов
  5. Интегральные индикаторы в ранговых шкалах
  6. Порождение признаков в прикладных задачах анализа данных
  7. Смеси моделей, многоуровневые модели, смеси экспертов
  8. Отыскание общих узлов в последовательности наборов метрических конфигураций
  9. Регрессионный анализ задачах математического моделирования. Найти пример использования регрессионного анализа в тех задачах математического моделирования в физике, химии, биологии, и т.д., где требуется получить модель, интерпретируемую в терминах предметной области
  10. Машинное обучение через 20 лет: какими методами АД (МО, ИИ, ЭС, АЗ,...) мы будем пользоваться? Какие задачи мы будет решать? Что я буду делать в своей профессиональной области?
Лекции/доклады студентов ==

К.В. Рудаков, семинар

Тема Автор Ссылка Дата Результат Сумма
Data Analysis Problem Statements in the Category Theory Language Рудой [76] 24 сентября NIR(3)+OK(5)+1/4 * [(0/GR)+(8/10)+(8/10AM)+(8/10AR)+(9/10)+(4.5/5)+(10/10)+(4.5/5)+(9/10)] 9.75
Machine Learning Problem Statements in Plate Notations Кокшаров [77] 24 сентября NIR(3)+OK(5)+1/4 * [(8/GR)+(0/MK)+(0/AM)+(0/AR)+(8/10)+(4.5/5)+(9/10)+(4/5)+(10/10)] 9
Deep Learning / Methods for Big Data Романенко [78] 1 октября NIR(3)+OK(5)+1/4 * [(9/10GR)+(9/10)+(7/10)+(0/AR)+(9/10)+(4/5)+(10/10)+(4.5/5)+(9/10)] 9
Usage of Copulas Мотренко [79] 1 октября NIR(3)+OK(5)+1/4 * [(10/10GR)+(9/10)+(0/AM)+(8/10)+(6/10)+(5/5)+(9/10)+(4.5/5)+(10/10)] 9,9
Problems of Voting, Expert Systems and Preference Learning Будников [80] 8 октября NIR(3)+OK(5)+1/4 * [(8/10)+(7/10)+(8/10)+(7/10)+(8/10)+(0/YB)+(10/10)+(4.5/5)+(7/10)] 9.6
Topic Modeling: PLSA, LDA et al. Сандуляну [81] 8 октября NIR(3)+OK(5)+1/4 * [(7/10)+(6/10)+(7/10)+(8/10)+(0/LS)+(3.5/5)+(9/10)+(4.5/5)+(10/10)] 9
MDL Principle Бурмистров [82] 15 октября NIR(3)+OK(5)+1/4 * [(0/10)+(0/10)+(8/10)+(7/10)+(10/10)+(4/5)+(0/MB)+(4/5)+(10/10)] 9.275
Data and Parameter Sampling and Applications Токмакова [83] 15 октября NIR(3)+OK(5)+1/4 * [(9/10)+(6/10)+(8/10)+(6/10)+(9/10)+(5/5)+(10/10)+(0/AT)+(10/10)] 9
Learning of games / Многорукие бандиты Ямщиков [84] 22 октября NIR(3)+OK(5) +1/4 * [(8/10)+(10/10)+(0/AM)+(0/AR)+(9/10)+(5/5)+(10/10)+(5/5)+(0/IY)] 9.425
Mixture of Experts (and Models) Адуенко [85] 29 октября (приглашенный лектор)

Дополнительно

  • Метрические вложения
  • Теория статистического обучения

Требования: Продолжительность: 1 академический час, 45 минут. Число слайдов: 20-30 (по вкусу).

  1. Раскрыть проблему постановки задачи Машинного обучения и анализа данных в данной теме
  2. Подобрать примеры постановки (и решения) известных (а может и узкоспециальных) задач

Рекомендации к стилю изложения:

  1. дать основные определения этой области
  2. привести теоретические примеры и основные свойства
  3. представить математические методы,
  4. дать теоретические постановки задач,
  5. привести приметы прикладных задач.

Оценки: макс. 7 баллов из 10 (5 за лекцию + 2 за тесты). Тест: готовит лектор, 5 вопросов со свободным ответом и вопрос «Основное сообщение лекции (2-3 предложения)». Результат теста: N из 5 (отображается в 1/4). 17 декабря – отчеты о научной работе.

Практика

А.А. Ивахненко: практика

Внешняя ссылка на технологическую карту проекта (редактирование возможно по доступу).

Домашнее задание S1.

  1. Постановка задачи и математическое описание алгоритма в файле Surname2013Title.tex и pdf (подумать над синтетическими данными).
  2. Описание интерфейса в общем файле Systemdocs:
    1. Литература: каждый добавляет свои ссылки на статьи с основным алгоритмом.
    2. Свой блок в общем файле IDEF0 (вSystemdocs пока не вставлять).
    3. Егор: Общее описание алгоритма.

Домашнее задание S2.

  1. Написать код, работающий на синтетических данных, доработать постановку задачи
  2. Технологии:
    1. Егор: дописать IDEF, описание проекта, интерфейс
    2. Илья: прочитать доклад о юнит-тестировании
    3. Александра: проверить тестовые данные и согласовать их постановкой задач
    4. Любовь: проверить постановки задач и описания алгоритмов (те, которые будут готовы)

Технологам нужно заполнить проверенные работы в таблице.

Домашнее задание S3.

  1. Написать юнит-тесты для кода, попытаться запустить алгоритм на реальных данных.
  2. Технологии:
    1. Любовь: утвердить все постановки задач, сшить постановки в общую статью (используя jmlda.sty)
    2. Георгий: проверить стиль кода, сделать замечания, предложить удобные обозначения переменных, согласованные с постановками задач
    3. Егор: проверить и утвердить IDEF0, описания данных и интерфейсов.
    4. Илья: проверить и утвердить юнит-тесты

Домашнее задание S4.

  1. Написать системные тесты, отпрофилировать, нарисовать картинки, написать комментарии.
  2. Технологии:
    1. Все - картинки с использованием географической карты (и других изображений - карты высот и карты SAR) с результатами и пояснениями для отчета
    2. Михаил Б.: список работающих тестов systemdocs
    3. Анастасия: Проверить результаты визуализации - содержимое и оформление, утвердить
    4. Александр: список историй успеха о профилировании, утвердить
    5. Егор: запуск системы, завершение systemdocs
    6. Михаил К.: отчет по разделам с картинками, часть systemdocs

А.А. Ивахненко: тест/экзамен

  • Токмакова -0,5 (3)
  • Бурмистров -2,5 (2)
  • Будников -1 (3)
  • Романенко -1,5 (2)
  • Ямщиков -0,5 (3)
  • Мотренко -3 (2)
  • Рудой -4,5 (1)
  • Кокшаров -6,5 (0,5)
  • Сандуляну -1,5 (2)

Минус баллы - это сколько было допущено ошибок. Дробные баллы за ошибки в неоднозначных вопросах или за достойные аргументы в поддержку своего ответа. Критерии (-1,5; 0] = 3, (-4; -1,5] = 2, (-inf; -4] = 1 с уменьшением по мере приближения к -inf.


Результаты

Автор S1 S2 S3 S4 Технолог Система Доклад Итог по проекту Сумма по курсу
Рудой 0 1 1 0 1 1 - 5 6
Кокшаров - - - - - 0 - 0*7 6.5
Романенко 1 1 1 1 1 1 - 7 9
Мотренко 1 1 1 1 1 1 - 7 9
Будников 1 1 1 1 1 1 - 7 10
Сандуляну 1 1 1 1 1 1 - 7 9
Бурмистров 1 1 1 1 1 1 - 7 9
Токмакова 1 1 1 1 1 1 - 7 10
Ямщиков 1 1 1 1 1 1 - 7 10
Личные инструменты