Машинное обучение (курс лекций, В.В.Китов)/2015-2016

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Второй семестр)
Текущая версия (17:13, 11 сентября 2016) (править) (отменить)
(Полностью удалено содержимое страницы)
 
(66 промежуточных версий не показаны.)
Строка 1: Строка 1:
-
[[Категория:Учебные курсы]]
 
-
{{TOCright}}
 
-
'''Машинное обучение''' (англ. machine learning) - наука об алгоритмах, которые сами настраиваются на известных данных, выделяя их характерную структуру и взаимосвязи между ними, для их компактного описания, визуализации и последующего предсказания новых аналогичных данных. Наука является сравнительно молодой, поскольку многие алгоритмы автоматической настройки на данных являются вычислительно трудоемкими, и их применение стало возможным только с появлением высокопроизводительных вычислительных средств. Основной акцент курса сделан на задачах предсказания дискретных величин (классификация) и непрерывных величин (регрессия), хотя в курсе также подробно рассматриваются смежные области - эффективное снижение размерности пространства, выделение наиболее значимых признаков для предсказания, методы оценивания и сравнения вероятностных распределений.
 
-
 
-
Курс читается студентам 3 курса кафедры «Математические методы прогнозирования» ВМиК МГУ, магистрам, зачисленным на эту кафедру, и не проходивших ранее аналогичных курсов, а также для всех желающих. На материал данного курса опираются последующие кафедральные курсы.
 
-
 
-
По изложению, рассматриваются математические основы методов, лежащие в их основе предположения о данных, взаимосвязи методов между собой и особенности их практического применения.
 
-
 
-
Курс сопровождается [[Машинное обучение (семинары, ВМК МГУ)|семинарами]], раскрывающими дополнительные темы курса и отрабатывающими навыки практического применения рассматриваемых методов. Практическое использование методов машинного обучения в основном будет вестись с использованием языка python и соответствующих библиотек для научных вычислений.
 
-
 
-
От студентов требуются знания линейной алгебры, математического анализа и теории вероятностей. Знание математической статистики, методов оптимизации и какого-либо языка программирования желательно, но не обязательно.
 
-
 
-
Курс во многом пересекается с [[Машинное обучение (курс лекций, К.В.Воронцов)|курсом К.В.Воронцова по машинному обучению]], с которым также рекомендуется ознакомиться.
 
-
 
-
=Программа курса=
 
-
 
-
==Первый семестр==
 
-
 
-
===Основные понятия и примеры прикладных задач.===
 
-
[[Media:Kitov-ML-01-Introduction.pdf|Скачать презентацию]]
 
-
 
-
===Метрические методы регрессии и классификации.===
 
-
[[Media:Kitov-ML-02-Metric methods.pdf|Скачать презентацию]]<br>
 
-
[[Media:Kitov-ML-03-Metric methods.pdf|Скачать презентацию (продолжение)]]
 
-
 
-
===Методы решающих деревьев.===
 
-
[[Media:Kitov-ML-04-Decision trees.pdf|Скачать презентацию]]<br>
 
-
[[Media:Kitov-ML-05-Decision trees.pdf|Скачать презентацию (продолжение)]]
 
-
 
-
===Оценивание моделей.===
 
-
[[media:Kitov-ML-05-Model_evaluation.pdf‎|Скачать презентацию]]
 
-
 
-
===Классификация линейными методами.===
 
-
[[media:Kitov-ML-06-Linear_classification_I.pdf‎‎|Скачать презентацию]]<br>
 
-
[[media:Kitov-ML-07-Linear_classification_II.pdf‎|Скачать презентацию (продолжение)]]
 
-
 
-
===Линейная и нелинейная регрессия.===
 
-
[[media:Kitov-ML-08-Regression.pdf‎|Скачать презентацию (обновлена 05.11.2015)]]
 
-
 
-
===Обобщение методов через ядра.===
 
-
[[media:Kitov-ML-09-Kernel methods.pdf|Скачать презентацию]]
 
-
 
-
===Байесовская теория классификации.===
 
-
Байесовский алгоритм классификации, минимизирующий цену. Случай одинаковых цен. Дискриминативные и генеративные модели. Частотный и байесовский подходы к оцениванию неизвестных параметров. Генеративные модели классификации с гауссовскими внутриклассовыми распределениями: модели LDA, QDA и RDA (QDA с регуляризацией), а также виды упрощающих предположений о матрице внутриклассовых ковариаций.
 
-
 
-
===Методы работы с пропущенными данными. Метод наивного Байеса.===
 
-
+мультиномиальная/биномиальная модель наивного Байеса для классификации текстов и преобразование TF-IDF.
 
-
+разложение ожидаемого квадрата ошибки на смещение и дисперсию (bias-variance tradeoff).
 
-
 
-
===Моделирование смесью распределений. ===
 
-
EM-алгоритм. Доказательство неубывания правдоподобия для EM-алгоритма. Вывод EM-алгоритма для смеси нормальных распределений в векторном случае. Подходы к определению числа компонент. Варианты снижения числа параметров и повышения устойчивости EM-алгоритма для смеси нормальных распределений.
 
-
 
-
===Ядерное сглаживание для оценки плотности.===
 
-
Случай одномерных и многомерных плотностей-основные ядерные функции. Условия сходимости к истинной плотности. Подходы к определению bandwidth (постоянного и зависящего от x).
 
-
 
-
===Кластеризация.===
 
-
K-средних. Инициализация EM-алгоритма кластеризацией. Мягкая кластеризация через EM-алгоритм.
 
-
 
-
==Второй семестр==
 
-
 
-
==Введение по практическому использованию алгоритмов машинного обучения==
 
-
 
-
===Ансамбли алгоритмов.===
 
-
Bias-Variance tradeoff, bagging, метод случайных подпространств, Random Forest, Extra Random Trees.
 
-
Жадный алгоритм построения линейных ансамблей (forward stagewise additive modelling). AdaBoost (с выводом).
 
-
 
-
===Ансамбли алгоритмов (продолжение).===
 
-
 
-
 
-
===Кластеризация.===
 
-
 
-
===Нейросети.===
 
-
 
-
===Глубинное обучение. ===
 
-
 
-
===Методы отбора признаков.===
 
-
 
-
===Линейные методы снижения размерности.===
 
-
 
-
===Нелинейные методы снижения размерности.===
 
-
 
-
===Коллаборативная фильтрация.===
 
-
 
-
===Online machine learning.===
 
-
 
-
===Теория переобучения и оценки обобщающей способности прогнозирующих алгоритмов.===
 
-
 
-
===Оптимизация процесса построения модели. Active learning.===
 
-
 
-
===Reinforcement learning.===
 

Текущая версия

Личные инструменты