Прикладные методы восстановления зависимостей в сложноорганизованных данных (курс лекций, О.В.Красоткина)
Материал из MachineLearning.
АНАЛИЗ СЛОЖНООРГАНИЗОВАННЫХ ДАННЫХ
Введение
ТЕМА 1. Построение и оценивание иерархических вероятностных моделей в типовых задачах восстановления зависимостей по эмпирическим данным (лекция 6 часов) Общие принципы построения иерархических вероятностных моделей в задачах восстановления зависимостей Построение иерархических вероятностных моделей для случая представления независимых и целевой переменной в различных шкалах Вероятностная модель для задачи линейной регрессии при представлении объектов потенциальными функциями для задачи оценивания положения сайта в результатах поискового запроса Квази-вероятностная модель для задачи распознавания образов на два класса Квази ввероятностная модель для оценивания порядковой регрессии на примере задачи оценивания положения сайта в результатах поискового запроса Квази-вероятностная модель для оценивания регрессионной модель Кокса на примере задачи анализа продолжительности жизни
ТЕМА 2. Задача восстановления нестационарных моделей сигналов (лекция 4 часа)
Общая структура оператора оценивания нестационарных моделей сигналов
Восстановление нестационарной регрессионной зависимости на примере задачи динамического анализа состава инвестиционного портфеля
Обучение распознаванию образов в нестационарной генеральной совокупности на примере задачи фильтрации спам адресов в результатах поискового запроса
Методы регуляризации при оценивания регрессионной модели Кокса на примере задачи определения признаков, влияющих на продолжительность жизни при различных заболеваниях
ТЕМА 3. Методы регуляризации в прикладных задачах восстановления зависимостей (лекция 4 часа)
Восстановление нестационарной регрессионной зависимости с ограничения на примере задачи динамического анализа состава инвестиционного портфеля пенсионного фонда
Вероятностная интерпретация методов Elastic Net, Lasso и регулируемой селективности в задачах восстановления зависимостей
Методы регуляризации при оценивания модели нестационарной регрессии на примере задачи определения активов, присутствующих в портфеле и активов, с помощью которых происходит управление инвестиционным портфелем
Оценивание нестационарной модели с сохранением локальных особенностей последовательности коэффициентов регрессии на примере определения моментов изменения политики управления инвестиционным портфелем
Методы регуляризации при оценивания модели порядковой регрессии на примере задачи определения характеристик, влияющих на положение сайта в результате поискового запроса, при поисковом продвижении сайтов
Методы регуляризации при оценивания регрессионной модели Кокса на примере задачи определения признаков, влияющих на продолжительность жизни при различных заболеваниях
ТЕМА 4 Способы оценивания значений непрерывных параметров в нестационарных моделях данных
Метод скользящего контроля для оценивания значений непрерывных параметров в моделях данных
Обобщение информационного критерия Акаике для выбора значений непрерывных параметров в моделях данных
Темы практических заданий для студентов 1. Исследования различных моделей формирования мгновенной доходности инвестиционного портфеля
2. Задача селективного оценивания коэффициентов многочлена Колмогорова – Габора при восстановлении зависимостей
3. Задача селективной одноклассовой классификации при параметризации цветового представления объектов на изображениях
4. Задача нестационарной одноклассовой классификации для задачи фильтрации спам адресов в результатах поискового запроса
5. Обучение распознаванию образов в нестационарной генеральной совокупности на примере задачи фильтрации спам адресов в результатах поискового запроса с отбором признаков
6. Задача ранговой регрессии с регулируемой селективностью для задачи для задачи оценивания положения сайта в результатах поискового запроса
7. Модель логистической регрессии с регулируемой селективностью для задачи оценивания положения сайта в результатах поискового запроса
8. Задача обучения распознаванию образов в режиме реального времени для задачи фильтрации спам адресов в результатах поискового запроса
9. Модель логистической регрессии с регулируемой селективностью для задачи сегментации изображений
10. Модель логистической регрессии с регулируемой селективностью для задачи сегментации изображений Отчетность по курсу 1. Заявка на грант по тематике исследований Российского фонда фундаментальных исследований (РФФИ) по конкурсу «Мой первый грант» или конкурс инициативных проектов (1 семестр)
2. Статья в журнал по тематике исследований (2 семестр)
3. Отчет по НИР (1 семестр и 2 семестр)
План учебной работы по курсу
Сентябрь
Тема 1
1. Выбор темы (1 неделя)
2. Постановка задачи (1 неделя)
3. Обзор предметной области и выявление актуальности темы исследования (2 недели)
Октябрь 4. Написание введения к статье и пунктов заявки на грант «Фундаментальная научная проблема, на решение которой направлен проект» и «Конкретная фундаментальная задача в рамках проблемы, на решение которой направлен проект» (1 неделя) 5. Анализ литературы по тематике исследования (2 недели) 6. Дополнение введения к статье обзором литературы по тематике исследования и написание пункта заявки на грант «Актуальность и современное состояние исследований по данной научной проблеме» (1 неделя)
Ноябрь 7. Разработка вероятностной модели задачи (1 неделя) 8. Подготовка презентации, описывающей постановку задачи, обсуждение в коллективе (1 неделя) 9. Подготовка пунктов заявки на грант «Предлагаемые методы и подходы (с оценкой степени новизны), «Календарный план» (1 неделя) 10. Подготовка пункта статьи «Вероятностная модель задачи» (1 неделя)
Декабрь Тема 2 11. Разработка методов регуляризации построенной вероятностной модели (2 неделя) 12. Разработка методов оценивания полученной регуляризованной модели (2 недели)
13. Подготовка раздела статьи, описывающего регуляризованную вероятностную модель и алгоритмы ее оценивания (2 недели) 14.
Февраль Тема 4
15. Создание экспериментального стенда (2 недели) 16. Подготовка тестовых данных (1 неделя) 17. Проведение экспериментов на тестовых данных(1 неделя)
Март 18. Подготовка реальных данных (1 неделя) 19. Проведение экспериментов на реальных данных(1 неделя) 20. Разработка раздела статьи, описывающего экспериментальную часть(2 недели)
Апрель 21. Подготовка статьи к публикации (1 неделя) 22. Написание отчета по гранту. (2 недели) 23. Подготовка презентации и доклада (1 неделя) 24. Доклад