|
|
(33 промежуточные версии не показаны) |
Строка 1: |
Строка 1: |
- | [[Категория:Учебные курсы]]
| |
- | {{TOCright}}
| |
| | | |
- | '''Машинное обучение''' (англ. machine learning) - наука об алгоритмах, которые сами настраиваются на известных данных, выделяя их характерную структуру и взаимосвязи между ними, для их компактного описания, визуализации и последующего предсказания новых аналогичных данных. Наука является сравнительно молодой, поскольку многие алгоритмы автоматической настройки на данных являются вычислительно трудоемкими, и их применение стало возможным только с появлением высокопроизводительных вычислительных средств. Основной акцент курса сделан на задачах предсказания дискретных величин (классификация) и непрерывных величин (регрессия), хотя в курсе также подробно рассматриваются смежные области - эффективное снижение размерности пространства, выделение наиболее значимых признаков для предсказания, методы оценивания и сравнения вероятностных распределений.
| |
- |
| |
- | Курс читается студентам 3 курса кафедры «Математические методы прогнозирования» ВМиК МГУ, магистрам, зачисленным на эту кафедру, и не проходивших ранее аналогичных курсов, а также для всех желающих. На материал данного курса опираются последующие кафедральные курсы.
| |
- |
| |
- | По изложению, рассматриваются математические основы методов, лежащие в их основе предположения о данных, взаимосвязи методов между собой и особенности их практического применения.
| |
- |
| |
- | Курс сопровождается [[Машинное обучение (семинары, ВМК МГУ)|семинарами]], раскрывающими дополнительные темы курса и отрабатывающими навыки практического применения рассматриваемых методов. Практическое использование методов машинного обучения в основном будет вестись с использованием языка python и соответствующих библиотек для научных вычислений.
| |
- |
| |
- | От студентов требуются знания линейной алгебры, математического анализа и теории вероятностей. Знание математической статистики, методов оптимизации и какого-либо языка программирования желательно, но не обязательно.
| |
- |
| |
- | Курс во многом пересекается с [[Машинное обучение (курс лекций, К.В.Воронцов)|курсом К.В.Воронцова по машинному обучению]], с которым также рекомендуется ознакомиться.
| |
- |
| |
- | =События вне курса=
| |
- |
| |
- | * 19 мая в 18-00 будут презентации прикладных проектов по курсу [http://www.machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B5%D1%82%D0%BE%D0%B4%D1%8B_%D0%B0%D0%B2%D1%82%D0%BE%D0%BC%D0%B0%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B9_%D0%BE%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B8_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%BE%D0%B2_%28%D0%BA%D1%83%D1%80%D1%81_%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D0%B9%2C_%D0%92.%D0%92.%D0%9A%D0%B8%D1%82%D0%BE%D0%B2%29/2016#.D0.9E.D0.B1.D1.8A.D1.8F.D0.B2.D0.BB.D0.B5.D0.BD.D0.B8.D1.8F "Методы автоматической обработки текстов"].
| |
- |
| |
- | * [https://www.youtube.com/channel/UCeq6ZIlvC9SVsfhfKnSvM9w Доклады, разбирающие решения kaggle-соревнований]
| |
- |
| |
- | =Программа курса=
| |
- |
| |
- | ==Первый семестр==
| |
- |
| |
- | ===Основные понятия и примеры прикладных задач.===
| |
- | [[Media:Kitov-ML-01-Introduction.pdf|Скачать презентацию]]
| |
- |
| |
- | ===Метрические методы регрессии и классификации.===
| |
- | [[Media:Kitov-ML-02-Metric methods.pdf|Скачать презентацию]]<br>
| |
- | [[Media:Kitov-ML-03-Metric methods.pdf|Скачать презентацию (продолжение)]]
| |
- |
| |
- | ===Методы решающих деревьев.===
| |
- | [[Media:Kitov-ML-04-Decision trees.pdf|Скачать презентацию]]<br>
| |
- | [[Media:Kitov-ML-05-Decision trees.pdf|Скачать презентацию (продолжение)]]
| |
- |
| |
- | ===Оценивание моделей.===
| |
- | [[media:Kitov-ML-05-Model_evaluation.pdf|Скачать презентацию]]
| |
- |
| |
- | ===Классификация линейными методами.===
| |
- | [[media:Kitov-ML-06-Linear_classification_I.pdf|Скачать презентацию]]<br>
| |
- | [[media:Kitov-ML-07-Linear_classification_II.pdf|Скачать презентацию (продолжение)]]
| |
- |
| |
- | ===Линейная и нелинейная регрессия.===
| |
- | [[media:Kitov-ML-08-Regression.pdf|Скачать презентацию (обновлена 05.11.2015)]]
| |
- |
| |
- | ===Обобщение методов через ядра.===
| |
- | [[media:Kitov-ML-09-Kernel methods.pdf|Скачать презентацию]]
| |
- |
| |
- | ===Байесовская теория классификации.===
| |
- | Байесовский алгоритм классификации, минимизирующий цену. Случай одинаковых цен. Дискриминативные и генеративные модели. Частотный и байесовский подходы к оцениванию неизвестных параметров. Генеративные модели классификации с гауссовскими внутриклассовыми распределениями: модели LDA, QDA и RDA (QDA с регуляризацией), а также виды упрощающих предположений о матрице внутриклассовых ковариаций.
| |
- |
| |
- | ===Методы работы с пропущенными данными. Метод наивного Байеса.===
| |
- | +мультиномиальная/биномиальная модель наивного Байеса для классификации текстов и преобразование TF-IDF.
| |
- | +разложение ожидаемого квадрата ошибки на смещение и дисперсию (bias-variance tradeoff).
| |
- |
| |
- | ===Моделирование смесью распределений. ===
| |
- | EM-алгоритм. Доказательство неубывания правдоподобия для EM-алгоритма. Вывод EM-алгоритма для смеси нормальных распределений в векторном случае. Подходы к определению числа компонент. Варианты снижения числа параметров и повышения устойчивости EM-алгоритма для смеси нормальных распределений.
| |
- |
| |
- | ===Ядерное сглаживание для оценки плотности.===
| |
- | Случай одномерных и многомерных плотностей-основные ядерные функции. Условия сходимости к истинной плотности. Подходы к определению bandwidth (постоянного и зависящего от x).
| |
- |
| |
- | ===Кластеризация.===
| |
- | K-средних. Инициализация EM-алгоритма кластеризацией. Мягкая кластеризация через EM-алгоритм.
| |
- |
| |
- | ==Второй семестр==
| |
- |
| |
- | ===Введение по практическому использованию алгоритмов машинного обучения===
| |
- |
| |
- | ===Ансамбли алгоритмов.===
| |
- | Bias-Variance tradeoff, bagging, метод случайных подпространств, Random Forest, Extra Random Trees.
| |
- | Жадный алгоритм построения линейных ансамблей (forward stagewise additive modelling). AdaBoost (с выводом).
| |
- |
| |
- | ===Бустинг.===
| |
- | Оптимизация ф-ций методом градиентного спуска с вариативным шагом и методом Ньютона.
| |
- | Градиентный бустинг (с примерами квадратичной ошибки, линейного персептрона и логистической ф-ции цены) и бустинг с локальной квадратичной аппроксимацией (с выводом для LogitBoost с вещественнозначными базовыми алгоритмами). Модификация алгоритма, когда базовые алгоритмы-деревья. Shrinkage и subsampling.
| |
- |
| |
- | [[Media:MMP-Boosting.pdf|Скачать презентацию]]
| |
- |
| |
- | Доп. материалы:
| |
- |
| |
- | [http://www.recognition.mccme.ru/pub/RecognitionLab.html/slbook.pdf Мерков. Введение в методы статистического обучения.]
| |
- |
| |
- | [http://web.stanford.edu/~hastie/local.ftp/Springer/OLD/ESLII_print4.pdf Hastie et. al. The Elements of Statistical Learning.]
| |
- |
| |
- | ===Нейросети.===
| |
- |
| |
- | ===Нейросети (продолжение).===
| |
- |
| |
- | Структура нейросетей для распознавания картинок. Пример. Идея глубинного обучения. Метод обратного распространения ошибок.
| |
- |
| |
- | [[Media:MMP-Neural networks.pdf|Скачать презентацию]]
| |
- |
| |
- | Доп. материалы:
| |
- |
| |
- | [https://www.coursera.org/login?course_id=256&r=https%3A%2F%2Fclass.coursera.org%2Fneuralnets-2012-001%2Flecture&user_action=class&topic_name=Neural%20Networks%20for%20Machine%20Learning лекции Джефри Хинтона по нейросетям]
| |
- |
| |
- | [http://deeplearning.net/tutorial/ Туториалы по глубинному обучению]
| |
- |
| |
- | [http://www.deeplearningbook.org/front_matter.pdf Книга Yoshua Bengio по глубинному обучению]
| |
- |
| |
- | [http://research.microsoft.com/pubs/209355/DeepLearning-NowPublishing-Vol7-SIG-039.pdf Детальный обзор по глубинному обучению от Microsoft Research]
| |
- |
| |
- | ===Бустинг & нейросети (продолжение).===
| |
- | xgBoost, DropOut, фиксированные схемы агрегации прогнозов (усреднение, голосование по большинству, учет рангов через BordaCount), stacking.
| |
- |
| |
- | [[Media:XgBoost_description.pdf|Скачать презентацию]]
| |
- |
| |
- | ===Линейные методы снижения размерности.===
| |
- |
| |
- | Метод главных компонент. Линейный дискриминант Фишера. Метод снижения размерности с учителем за счет итеративного применения линейной классификации.
| |
- |
| |
- | [[Media:MMP-Principal_components_analysis.pdf|Скачать презентацию]]
| |
- |
| |
- | ===Методы отбора признаков.===
| |
- | [[Media:MMP-Feature_selection.pdf|Скачать презентацию]]
| |
- |
| |
- | ===Нелинейные методы снижения размерности.===
| |
- | [[Media:MMP-Nonlinear_dimensionality_reduction.pdf|Скачать презентацию]]
| |
- |
| |
- | ===Частичное обучение (semi-supervised learning).===
| |
- | [[Media:ММРО_-_Задачи_с_частичным_обучением.pdf|Частичное обучение - презентация К.В.Воронова]]
| |
- |
| |
- | ===Кластеризация.===
| |
- | [[Media:ММРО_-_Разделение_смеси_распределений.pdf|Разделение смеси распределений - презентация К.В.Воронова]]
| |
- |
| |
- | ===Коллаборативная фильтрация.===
| |
- |
| |
- | ===Оптимизация процесса построения обучающего множества (active learning).===
| |