Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 874, осень 2013

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Лекции студентов)
Текущая версия (06:41, 4 сентября 2014) (править) (отменить)
(Семинар К.В. Рудакова, посвященный подготовке дипломных работ)
 
(27 промежуточных версий не показаны.)

Текущая версия


Семинар К.В. Рудакова

Автор Название дипломной работы Научный руководитель Результат
Георгий Рудой Алгоритмы порождения экспертно-интерпретируемых моделей В.В. Стрижов
Михаил Кокшаров Методы дискретизации электрокардиосигналов для диагностики заболеваний К.В. Воронцов
Александр Романенко Применение условных случайных полей в задачах обработки текстов на естественном языке К.В. Воронцов
Анастасия Мотренко Оценка объема выборки в задачах прогнозирования В.В. Стрижов
Егор Будников Применение методов машинного обучения для решения задачи выделения именованных сущностей из текстов на естественном языке О.В. Красоткина
Любовь Сандуляну Байесовский подход к построению одноклассового классификатора в задачах обнаружения текстовых заимствований и фильтрации нежелательной почты Ю.В. Чехович
Михаил Бурмистров Дифференциальный скользящий контроль при выборе параметров регуляризации в задаче регрессионного анализа с помощью Elastic Net В.В. Моттль
Александра Токмакова Выбор устойчивых прогностических моделей в задачах нелинейного регрессионного анализа В.В. Стрижов
Илья Ямщиков Математические методы диагностики ишемической болезни по электрокардиограмме сверхвысокого разрешения. К.В. Воронцов

Эссе

В.В. Стрижов, экзамен

Автор 1 2 3 4 5 6 7 8 9 10, результат
Рудой 1[1] 2[2] 3[3] 4[4] 5[5] 6[6] 7[7] 8[8] 8 8
Кокшаров 1[9] 1 2[10] 2 3[11] 4[12] 5[13] 6[14] 7[15] 7
Романенко 1[16] 2[17] 3[18] 4[19] 5[20] 6[21] 7[22] 7 8[23] 9[24]
Мотренко 1[25] 2[26] 3[27] 4[28] 5[29] 6[30] 7[31] 8[32] 8 9[33]
Будников 1[34] 2[35] 3[36] 4[37] 5[38] 6[39] 7[40] 8[41] 8 8
Сандуляну 1[42] 2[43] 3[44] 4[45] 5[46] 6[47] 7[48] 8[49] 8 8
Бурмистров 1[50] 2[51] 3[52] 4[53] 5[54] 6[55] 7[56] 8[57] 9[58] 10[59]
Токмакова 1[60] 2[61] 3[62] 4[63] 5[64] 6[65] 7[66] 8[67] 8 8
Ямщиков 1[68] 1 2[69] 2 3[70] 4[71] 5[72] 6[73] 7[74] 8[75]

Список тем

  1. Аппроксимация множества точек замкнутыми кривыми
  2. Метод группового учета аргументов в краткой нотации
  3. Заполнение пропусков в порядковых шкалах (и в шкалах без отношения полного порядка)
  4. Роль Матрицы Ганкеля в прогнозировании временных рядов
  5. Интегральные индикаторы в ранговых шкалах
  6. Порождение признаков в прикладных задачах анализа данных
  7. Смеси моделей, многоуровневые модели, смеси экспертов
  8. Отыскание общих узлов в последовательности наборов метрических конфигураций
  9. Регрессионный анализ задачах математического моделирования. Найти пример использования регрессионного анализа в тех задачах математического моделирования в физике, химии, биологии, и т.д., где требуется получить модель, интерпретируемую в терминах предметной области
  10. Машинное обучение через 20 лет: какими методами АД (МО, ИИ, ЭС, АЗ,...) мы будем пользоваться? Какие задачи мы будет решать? Что я буду делать в своей профессиональной области?
Лекции/доклады студентов ==

К.В. Рудаков, семинар

Тема Автор Ссылка Дата Результат Сумма
Data Analysis Problem Statements in the Category Theory Language Рудой [76] 24 сентября NIR(3)+OK(5)+1/4 * [(0/GR)+(8/10)+(8/10AM)+(8/10AR)+(9/10)+(4.5/5)+(10/10)+(4.5/5)+(9/10)] 9.75
Machine Learning Problem Statements in Plate Notations Кокшаров [77] 24 сентября NIR(3)+OK(5)+1/4 * [(8/GR)+(0/MK)+(0/AM)+(0/AR)+(8/10)+(4.5/5)+(9/10)+(4/5)+(10/10)] 9
Deep Learning / Methods for Big Data Романенко [78] 1 октября NIR(3)+OK(5)+1/4 * [(9/10GR)+(9/10)+(7/10)+(0/AR)+(9/10)+(4/5)+(10/10)+(4.5/5)+(9/10)] 9
Usage of Copulas Мотренко [79] 1 октября NIR(3)+OK(5)+1/4 * [(10/10GR)+(9/10)+(0/AM)+(8/10)+(6/10)+(5/5)+(9/10)+(4.5/5)+(10/10)] 9,9
Problems of Voting, Expert Systems and Preference Learning Будников [80] 8 октября NIR(3)+OK(5)+1/4 * [(8/10)+(7/10)+(8/10)+(7/10)+(8/10)+(0/YB)+(10/10)+(4.5/5)+(7/10)] 9.6
Topic Modeling: PLSA, LDA et al. Сандуляну [81] 8 октября NIR(3)+OK(5)+1/4 * [(7/10)+(6/10)+(7/10)+(8/10)+(0/LS)+(3.5/5)+(9/10)+(4.5/5)+(10/10)] 9
MDL Principle Бурмистров [82] 15 октября NIR(3)+OK(5)+1/4 * [(0/10)+(0/10)+(8/10)+(7/10)+(10/10)+(4/5)+(0/MB)+(4/5)+(10/10)] 9.275
Data and Parameter Sampling and Applications Токмакова [83] 15 октября NIR(3)+OK(5)+1/4 * [(9/10)+(6/10)+(8/10)+(6/10)+(9/10)+(5/5)+(10/10)+(0/AT)+(10/10)] 9
Learning of games / Многорукие бандиты Ямщиков [84] 22 октября NIR(3)+OK(5) +1/4 * [(8/10)+(10/10)+(0/AM)+(0/AR)+(9/10)+(5/5)+(10/10)+(5/5)+(0/IY)] 9.425
Mixture of Experts (and Models) Адуенко [85] 29 октября (приглашенный лектор)

Дополнительно

  • Метрические вложения
  • Теория статистического обучения

Требования: Продолжительность: 1 академический час, 45 минут. Число слайдов: 20-30 (по вкусу).

  1. Раскрыть проблему постановки задачи Машинного обучения и анализа данных в данной теме
  2. Подобрать примеры постановки (и решения) известных (а может и узкоспециальных) задач

Рекомендации к стилю изложения:

  1. дать основные определения этой области
  2. привести теоретические примеры и основные свойства
  3. представить математические методы,
  4. дать теоретические постановки задач,
  5. привести приметы прикладных задач.

Оценки: макс. 7 баллов из 10 (5 за лекцию + 2 за тесты). Тест: готовит лектор, 5 вопросов со свободным ответом и вопрос «Основное сообщение лекции (2-3 предложения)». Результат теста: N из 5 (отображается в 1/4). 17 декабря – отчеты о научной работе.

Практика

А.А. Ивахненко: практика

Внешняя ссылка на технологическую карту проекта (редактирование возможно по доступу).

Домашнее задание S1.

  1. Постановка задачи и математическое описание алгоритма в файле Surname2013Title.tex и pdf (подумать над синтетическими данными).
  2. Описание интерфейса в общем файле Systemdocs:
    1. Литература: каждый добавляет свои ссылки на статьи с основным алгоритмом.
    2. Свой блок в общем файле IDEF0 (вSystemdocs пока не вставлять).
    3. Егор: Общее описание алгоритма.

Домашнее задание S2.

  1. Написать код, работающий на синтетических данных, доработать постановку задачи
  2. Технологии:
    1. Егор: дописать IDEF, описание проекта, интерфейс
    2. Илья: прочитать доклад о юнит-тестировании
    3. Александра: проверить тестовые данные и согласовать их постановкой задач
    4. Любовь: проверить постановки задач и описания алгоритмов (те, которые будут готовы)

Технологам нужно заполнить проверенные работы в таблице.

Домашнее задание S3.

  1. Написать юнит-тесты для кода, попытаться запустить алгоритм на реальных данных.
  2. Технологии:
    1. Любовь: утвердить все постановки задач, сшить постановки в общую статью (используя jmlda.sty)
    2. Георгий: проверить стиль кода, сделать замечания, предложить удобные обозначения переменных, согласованные с постановками задач
    3. Егор: проверить и утвердить IDEF0, описания данных и интерфейсов.
    4. Илья: проверить и утвердить юнит-тесты

Домашнее задание S4.

  1. Написать системные тесты, отпрофилировать, нарисовать картинки, написать комментарии.
  2. Технологии:
    1. Все - картинки с использованием географической карты (и других изображений - карты высот и карты SAR) с результатами и пояснениями для отчета
    2. Михаил Б.: список работающих тестов systemdocs
    3. Анастасия: Проверить результаты визуализации - содержимое и оформление, утвердить
    4. Александр: список историй успеха о профилировании, утвердить
    5. Егор: запуск системы, завершение systemdocs
    6. Михаил К.: отчет по разделам с картинками, часть systemdocs

А.А. Ивахненко: тест/экзамен

  • Токмакова -0,5 (3)
  • Бурмистров -2,5 (2)
  • Будников -1 (3)
  • Романенко -1,5 (2)
  • Ямщиков -0,5 (3)
  • Мотренко -3 (2)
  • Рудой -4,5 (1)
  • Кокшаров -6,5 (0,5)
  • Сандуляну -1,5 (2)

Минус баллы - это сколько было допущено ошибок. Дробные баллы за ошибки в неоднозначных вопросах или за достойные аргументы в поддержку своего ответа. Критерии (-1,5; 0] = 3, (-4; -1,5] = 2, (-inf; -4] = 1 с уменьшением по мере приближения к -inf.


Результаты

Автор S1 S2 S3 S4 Технолог Система Доклад Итог по проекту Сумма по курсу
Рудой 0 1 1 0 1 1 - 5 6
Кокшаров - - - - - 0 - 0*7 6.5
Романенко 1 1 1 1 1 1 - 7 9
Мотренко 1 1 1 1 1 1 - 7 9
Будников 1 1 1 1 1 1 - 7 10
Сандуляну 1 1 1 1 1 1 - 7 9
Бурмистров 1 1 1 1 1 1 - 7 9
Токмакова 1 1 1 1 1 1 - 7 10
Ямщиков 1 1 1 1 1 1 - 7 10
Личные инструменты