Математические основы теории прогнозирования (курс лекций)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(+ результаты переписывания контрольной)
Текущая версия (16:15, 11 сентября 2014) (править) (отменить)
м
 
(80 промежуточных версий не показаны.)
Строка 1: Строка 1:
__NOTOC__
__NOTOC__
-
 
-
{{notice|Внимание! Объявлены результаты переписывания контрольной работы. Показ незачетных работ пройдет 2 мая. Подробности см. ниже.}}
 
{| border="0"
{| border="0"
Строка 8: Строка 6:
|}
|}
-
Лектор: [[Участник:Сенько Олег|д.ф.-м.н. Сенько Олег Валентинович]]
+
Лектор: [[Участник:Сенько Олег|Сенько Олег Валентинович]]
 +
 
 +
Ассистент: [[Участник:Kropotov|Кропотов Д.А.]]
 +
 
 +
Свои вопросы по курсу и пожелания можно оставлять на вкладке «Обсуждение» к этой странице или направлять письмом по адресу ''bayesml@gmail.com'', в название письма просьба добавлять [МОТП14].
 +
 
 +
В весеннем семестре 2014 года курс читается на ВМК по средам в ауд. П-8а, начало в 10:30.
== Контрольная работа ==
== Контрольная работа ==
Строка 15: Строка 19:
При написании контрольной работы разрешается пользоваться любыми бумажными материалами, а также калькуляторами. Использование электронных устройств (кроме калькуляторов) запрещено.
При написании контрольной работы разрешается пользоваться любыми бумажными материалами, а также калькуляторами. Использование электронных устройств (кроме калькуляторов) запрещено.
-
[[Media:MOTP12_test_var.pdf|Тестовый вариант (PDF, 21Кб)]]
+
[[Media:MOTP13_test_var.pdf|Пример варианта из контрольной 2013 года (pdf)]]
-
=== Список студентов, допущенных к экзамену по результатам контрольной работы (с учетом переписывания) ===
+
[[Media:MOTP12_test_var.pdf|Тестовый вариант 2012 года (pdf)]]
-
В фамилиях и номерах групп возможны неточности, т.к. почерк не всегда легко разобрать.
+
-
{| class="standard"
+
[https://docs.google.com/spreadsheets/d/1E1J75NvYxFWzoNnLI6C2yWpPeMfEUMZbCNIuKKTzWtw/edit?usp=sharing Результаты контрольной]
-
!Группа 420|| Группа 421 || Группа 422 || Группа 424 || Группа 425 || Группа 427 || Группа 428
+
-
|-
+
-
| Костин || Новикова || Пискун || Алейников || Свиридов || Шубин || Тарасевич
+
-
|-
+
-
| Кисляков || Новоторцев || Глонина || Леонова || Самохина || Фролов || Асташкин
+
-
|-
+
-
| Калужин || Акимов || Самойлов || Ветров || Попеско || Луговской || Мордань
+
-
|-
+
-
| Александрычева || Шальнов || Самосадный || Светлов || Переходько || Петушкова || Гомзин
+
-
|-
+
-
| Банников || Карпухин || Калистратова || Рогова || Пузиков || Ющенко || Синева
+
-
|-
+
-
| Исламгулов || Меркулов || Артемов || Костарев || Второв || Киров || Ефимов
+
-
|-
+
-
| Романенков || Батанов || Шилов || Мошкина || Степанов || Федоренко || Устинова
+
-
|-
+
-
| Куркин || Ерофеев || Плотников || Парамонов || Шариков || Акциперов || Терзи
+
-
|-
+
-
| Челнокова || Птенцов || Бабак || Копин || || Пустовалов || Агаев
+
-
|-
+
-
| || Гурьянов || Булгаков || Вайсман || || Гладкова || Бадретдинов
+
-
|-
+
-
| || Зачесов || Ермишкин || Пояркова || || Сепевенко || Ушаков
+
-
|-
+
-
| || Сапатов || || Лоза || || Коцыняк || Шуберт
+
-
|-
+
-
| || Пироженко || || Нечаев || || Лукин ||
+
-
|-
+
-
| || Сумин || || Ростовский || || Федотов ||
+
-
|-
+
-
| || Самсонов || || || || Голушко ||
+
-
|-
+
-
| || Конев || || || || ||
+
-
|-
+
-
|}
+
-
Показ незачетных работ при переписывании контрольной пройдет в ближайшую среду, {{важно|2 мая}} в ауд. 573 с 14-30 до 16-50. Для участия в показе необходимо предварительно [https://docs.google.com/spreadsheet/ccc?key=0AjJRWGauOsXTdGJNNldneGw3LTRjeDZndXVKdTViOWc записаться] не позднее вечера вторника 1 мая.
+
== Экзамен ==
 +
К сдаче экзамена допускаются только студенты, успешно справившиеся с контрольной работой. На экзамене при подготовке билета разрешается пользоваться любыми материалами (в том числе с электронных устройств). При ответе ничем пользоваться нельзя. Обратите внимание на вопросы теоретического минимума — незнание ответов на эти вопросы влечёт неудовлетворительную оценку за экзамен.
-
== Презентации к лекциям ==
+
[[Media:MOTP14_exam.pdf|Теоретический минимум + вопросы]]
-
{|class="standard"
+
 
-
! Лекция !! Материалы
+
== Материалы ==
-
|-
+
{|class = "standard"
-
| align="center"|1 || [[Media:MOTP12_1.pdf|Презентация (PDF, 364Кб)]]
+
! Номер лекции !! Название
-
|-
+
|-
-
| align="center"|2 || [[Media:MOTP12_2.pdf|Презентация (PDF, 302Кб)]]
+
| align="center"|1 || [[Media:MOTP14_1.pdf|Задачи прогнозирования, обобщающая способность, скользящий контроль]]
-
|-
+
|-
-
| align="center"|3 || [[Media:MOTP12_3.pdf|Презентация (PDF, 204Кб)]]
+
| align="center"|2 || [[Media:MOTP14_2.pdf|Линейная машина, теория Вапника-Червоненкиса]]
-
|-
+
|-
-
| align="center"|4 || [[Media:MOTP12_4.pdf|Презентация (PDF, 267Кб)]]
+
| align="center"|3 || [[Media:MOTP14_3.pdf|Линейная регрессия]] {{важно|(обновлено 11.06.)}}
-
|-
+
|-
-
| align="center"|5 || [[Media:MOTP12_5.pdf|Презентация (PDF, 493Кб)]]
+
| align="center"|4 || [[Media:MOTP14_4.pdf|Байесовский классификатор, линейный дискриминант Фишера, логистическая регрессия, К-ближайших соседей, ROC-кривые]]
-
|-
+
|-
-
| align="center"|6 || [[Media:MOTP12_6.pdf|Презентация (PDF, 493Кб)]]
+
| align="center"|5 || [[Media:MOTP14_5.pdf|Тестовый алгоритм, алгоритм вычисления оценок]]
-
|-
+
|-
-
| align="center"|7 || [[Media:MOTP12_7.pdf|Презентация (PDF, 493Кб)]]
+
| align="center"|6 || [[Media:MOTP14_6.pdf|Нейросетевые методы]]
-
|-
+
|-
-
|}
+
| align="center"|7 || [[Media:MOTP14_7.pdf|Ядерные методы, метод опорных векторов]] {{важно|(обновлено 11.06.)}}
 +
|-
 +
| align="center"|8 || [[Media:MOTP14_8.pdf|Решающие деревья]]
 +
|-
 +
| align="center"|9 || [[Media:MOTP14_9.pdf|Структура ошибки выпуклых комбинаций, комитетные методы, логическая коррекция]]
 +
|-
 +
| align="center"|10 || [[Media:MOTP14_10.pdf|Коллективные методы, бэггинг, бустинг, голосование по системам закономерностей]]
 +
|-
 +
| align="center"|11 || [[Media:MOTP14_11.pdf|Методы кластерного анализа, метод главных компонент]]
 +
|-
 +
| align="center"|12 || [[Media:MOTP14_12.pdf|Байесовские сети, анализ выживаемости]]
 +
|-
 +
|}
== Программа курса ==
== Программа курса ==
 +
# Область применения методов, основанных на [[Обучение по прецедентам|обучении по прецедентам]]. Способ обучения, основанный на [[Минимизация эмпирического риска|минимизации эмпирического риска]].
 +
# Понятие [[Обобщающая способность|обобщающей способности]]. Способы оценки обобщающей способности. Смысл эффекта переобучения.
 +
# Теоретические подходы к исследованию обобщающей способности. [[Байесовский классификатор|Байесовский классификатор]]. Лемма Неймана-Пирсона. Основные положения [[Теория Вапника-Червоненкиса|теории Вапника-Червоненкиса]].
 +
# Простая и многомерная [[Многомерная линейная регрессия|линейная регрессия]].
 +
# Структура алгоритма распознавания. Оценка эффективности распознающих операторов. ROC-анализ.
 +
# Статистические методы распознавания.
 +
# Комбинаторно-логические методы. [[Алгоритмы вычисления оценок|Алгоритмы вычисления оценок]].
 +
# Нейросетевые методы.
 +
# [[Машина опорных векторов|Метод опорных векторов]].
 +
# [[Решающее дерево|Решающие деревья]].
 +
# Коллективные методы распознавания. Простые комитетные методы. [[Наивный байесовский классификатор|Наивный байесовский классификатор]]. Логическая коррекция. Основы алгебраической коррекции. Операции над распознающими операторами. Линейное и алгебраическое замыкания множеств распознающих операторов.
 +
# Методы, основанные на коллективных решениях по наборам логических закономерностей, а также по областям признакового пространства, выделенных с помощью оптимальных разбиений.
 +
# Методы [[Кластеризация|кластерного анализа]]. Методы проектирования многомерных векторов описаний объектов обучающей выборки на плоскость. [[Метод главных компонент|Метод главных компонент]].
 +
# Методы [[Анализ выживаемости|анализа выживаемости]] (надёжности). Кривые выживаемости. [[Процедура Каплана-Мейера|Оценки Каплан-Майера]]. Модель Кокса.
 +
# Методы прогнозирования [[Временной ряд|временных рядов]].
 +
 +
<!--
==== Различные постановки задач [[Машинное обучение|машинного обучения]] ====
==== Различные постановки задач [[Машинное обучение|машинного обучения]] ====
Постановка задач машинного обучения. Задачи распознавания и прогнозирования числовых переменных по признаковым описаниям. Настройка алгоритмов по выборкам прецедентов. Обучающая [[Выборка|выборка]]. [[Обобщающая способность]]. Области использования методов машинного обучения.
Постановка задач машинного обучения. Задачи распознавания и прогнозирования числовых переменных по признаковым описаниям. Настройка алгоритмов по выборкам прецедентов. Обучающая [[Выборка|выборка]]. [[Обобщающая способность]]. Области использования методов машинного обучения.
Строка 110: Строка 108:
==== Уменьшение размерности описания данных. [[Метод главных компонент]] ====
==== Уменьшение размерности описания данных. [[Метод главных компонент]] ====
Проблема анализа многомерных данных. Метод главных компонент. Выбор размерности редуцированного пространства.
Проблема анализа многомерных данных. Метод главных компонент. Выбор размерности редуцированного пространства.
 +
-->
== Литература ==
== Литература ==
Строка 117: Строка 116:
== Страницы курса прошлых лет ==
== Страницы курса прошлых лет ==
 +
 +
[[МОТП/2012|2012 год]]
 +
[[МОТП/2011|2011 год]]
[[МОТП/2011|2011 год]]
-
== Ссылки ==
+
== См. также ==
-
[[Машинное обучение (курс лекций, К.В.Воронцов)|Машинное обучение (курс лекций, К.В. Воронцов)]]
+
[http://shad.yandex.ru/lectures/machine_learning.xml Видео-лекции по курсу «Машинное обучение» в Школе анализа данных Яндекса]
-
[[Бммо|Байесовские методы машинного обучения (спецкурс, Д.П. Ветров, Д.А. Кропотов, А.А. Осокин)]]
+
[http://work.caltech.edu/telecourse.html Простой в освоении видео-курс по машинному обучению (на английском)]
-
[http://www.cmcspec.ru/ipb/index.php?showtopic=1006 Форум студентов ВМиК с обсуждением курса]
+
[[Машинное обучение (курс лекций, К.В.Воронцов)|Машинное обучение (курс лекций, К.В. Воронцов)]]
[[ММП|Математические методы прогнозирования (кафедра ВМиК МГУ)]]
[[ММП|Математические методы прогнозирования (кафедра ВМиК МГУ)]]
[[Категория:Учебные курсы]]
[[Категория:Учебные курсы]]

Текущая версия


   Курс посвящен изучению современных методов диагностики и прогнозирования, основанных на машинном обучении, а также современных методов интеллектуального анализа данных. Даётся обзор современных методов распознавания, включая статистические, нейросетевые, комбинаторно-логические, алгебраические модели, модель опорных векторов. Рассматривается основная проблематика методов машинного обучения, включая эффект переобучения. Изучаются вопросы оценки точности классифицирующих правил или прогностических функций. Рассматривается метод ROC анализа. Изучаются методы интеллектуального анализа данных, включая методы кластерного анализа, многомерного шкалирования, а также метод главных компонент. Рассматриваются математические модели анализа надёжности.

Лектор: Сенько Олег Валентинович

Ассистент: Кропотов Д.А.

Свои вопросы по курсу и пожелания можно оставлять на вкладке «Обсуждение» к этой странице или направлять письмом по адресу bayesml@gmail.com, в название письма просьба добавлять [МОТП14].

В весеннем семестре 2014 года курс читается на ВМК по средам в ауд. П-8а, начало в 10:30.

Контрольная работа

В программе курса предусмотрена письменная контрольная работа. Успешное написание контрольной работы является обязательным условием допуска к экзамену по курсу. При отсутствии допуска студент пишет контрольную работу на экзамене и в случае успеха сдает экзамен на первой пересдаче.

При написании контрольной работы разрешается пользоваться любыми бумажными материалами, а также калькуляторами. Использование электронных устройств (кроме калькуляторов) запрещено.

Пример варианта из контрольной 2013 года (pdf)

Тестовый вариант 2012 года (pdf)

Результаты контрольной

Экзамен

К сдаче экзамена допускаются только студенты, успешно справившиеся с контрольной работой. На экзамене при подготовке билета разрешается пользоваться любыми материалами (в том числе с электронных устройств). При ответе ничем пользоваться нельзя. Обратите внимание на вопросы теоретического минимума — незнание ответов на эти вопросы влечёт неудовлетворительную оценку за экзамен.

Теоретический минимум + вопросы

Материалы

Номер лекции Название
1 Задачи прогнозирования, обобщающая способность, скользящий контроль
2 Линейная машина, теория Вапника-Червоненкиса
3 Линейная регрессия (обновлено 11.06.)
4 Байесовский классификатор, линейный дискриминант Фишера, логистическая регрессия, К-ближайших соседей, ROC-кривые
5 Тестовый алгоритм, алгоритм вычисления оценок
6 Нейросетевые методы
7 Ядерные методы, метод опорных векторов (обновлено 11.06.)
8 Решающие деревья
9 Структура ошибки выпуклых комбинаций, комитетные методы, логическая коррекция
10 Коллективные методы, бэггинг, бустинг, голосование по системам закономерностей
11 Методы кластерного анализа, метод главных компонент
12 Байесовские сети, анализ выживаемости

Программа курса

  1. Область применения методов, основанных на обучении по прецедентам. Способ обучения, основанный на минимизации эмпирического риска.
  2. Понятие обобщающей способности. Способы оценки обобщающей способности. Смысл эффекта переобучения.
  3. Теоретические подходы к исследованию обобщающей способности. Байесовский классификатор. Лемма Неймана-Пирсона. Основные положения теории Вапника-Червоненкиса.
  4. Простая и многомерная линейная регрессия.
  5. Структура алгоритма распознавания. Оценка эффективности распознающих операторов. ROC-анализ.
  6. Статистические методы распознавания.
  7. Комбинаторно-логические методы. Алгоритмы вычисления оценок.
  8. Нейросетевые методы.
  9. Метод опорных векторов.
  10. Решающие деревья.
  11. Коллективные методы распознавания. Простые комитетные методы. Наивный байесовский классификатор. Логическая коррекция. Основы алгебраической коррекции. Операции над распознающими операторами. Линейное и алгебраическое замыкания множеств распознающих операторов.
  12. Методы, основанные на коллективных решениях по наборам логических закономерностей, а также по областям признакового пространства, выделенных с помощью оптимальных разбиений.
  13. Методы кластерного анализа. Методы проектирования многомерных векторов описаний объектов обучающей выборки на плоскость. Метод главных компонент.
  14. Методы анализа выживаемости (надёжности). Кривые выживаемости. Оценки Каплан-Майера. Модель Кокса.
  15. Методы прогнозирования временных рядов.


Литература

  1. Журавлев Ю.И., Рязанов В.В., Сенько О.В. Распознавание. Математические методы. Программная система. Практические применения, М.: Фазис, 2006. (ISBN 5-7036-0108-8)
  2. Ветров Д.П., Кропотов Д.А. Байесовские методы машинного обучения, учебное пособие по спецкурсу, 2007 (Часть 1, PDF 1.22МБ; Часть 2, PDF 1.58МБ)
  3. Bishop C.M. Pattern Recognition and Machine Learning. Springer, 2006.

Страницы курса прошлых лет

2012 год

2011 год

См. также

Видео-лекции по курсу «Машинное обучение» в Школе анализа данных Яндекса

Простой в освоении видео-курс по машинному обучению (на английском)

Машинное обучение (курс лекций, К.В. Воронцов)

Математические методы прогнозирования (кафедра ВМиК МГУ)

Личные инструменты