Глубокое машинное обучение (онлайн-учебник)
Материал из MachineLearning.
Китов В.В. Глубокое машинное обучение, 2024, онлайн-учебник.
Аннотация
Онлайн-учебник по машинному обучению и глубокому обучению (нейросетям) на основе курсов "Методы машинного обучения" и "Глубокое машинное обучение", читаемых на факультете ВМК МГУ им. Ломоносова.
Первая часть учебника описывает весь процесс построения моделей машинного обучения (machine learning):
- постановка и формализация задачи
- подготовка данных
- выбор модели и подбор гиперпараметров
- меры качества оценки моделей
- оценка качества и интерпретация результатов
В ней рассматриваются методы классического машинного обучения:
- метрические методы
- линейные модели
- деревья решений.
Описывается, как алгоритмы машинного обучения решают задачу регрессии и классификации, а также основные функции потерь и меры качества для указанных задач.
Особое внимание уделяется построению прогнозов, используя не одну а композицию разных моделей (ансамбль). Рассматриваются популярные методы построения ансамблей моделей, такие как
- бэггинг
- метод случайных подпространств
- случайный лес
- особо случайные деревья
- бустинг.
В конце учебника рассматриваются подходы к интерпретации настроенных моделей машинного обучения и полученных с их помощью прогнозов.
Вторая часть учебника посвящена глубокому обучению (deep learning), то есть использованию нейросетей в задачах эффективного представления знаний (representation learning) и прогнозирования.
Рассматривается обработка табличных данных, последовательностей, текстов и изображений с помощью нейросетей.
Описываются основные нейросетевые архитектуры:
- многослойный персептрон
- свёрточные нейросети для обработки последовательностей и изображений
- автокодировщики
- сиамские сети
- рекуррентные сети
- трансформеры
- графовые нейросети.
Изучаются методы эффективной настройки глубоких нейросетевых моделей, включающие начальную инициализацию моделей и методы оптимизации нейросетей.
Особое внимание уделено способам регуляризации нейросетевых моделей, чтобы контролировать степень переобучения.
Помимо задач регрессии и классификации, рассматриваются и другие применения глубоких нейросетей:
- семантическая сегментация, детекция объектов и instance-сегментация
- построение эмбеддингов слов и параграфов текста
- генерация текстов и последовательностей других дискретных объектов
- классификация вершин и рёбер графа, учитывая их геометрическое расположение
- восстанавление недостающих рёбер на графе.