Машинное обучение (РЭУ)
Материал из MachineLearning.
(→N1 - Проверка работы метода K-NN) |
(→N3 - Поиск наилучшей модели для оценки съедобности грибов) |
||
Строка 21: | Строка 21: | ||
===N3 - Поиск наилучшей модели для оценки съедобности грибов=== | ===N3 - Поиск наилучшей модели для оценки съедобности грибов=== | ||
+ | |||
+ | ====Срок: до 24 апреля.==== | ||
[[Media:REU_ML-Mushrooms.zip|скачать задание и данные]] | [[Media:REU_ML-Mushrooms.zip|скачать задание и данные]] | ||
+ | |||
+ | Необходимо: разработать модель, дающую 100% точность на кросс-валидации и отослать мне ipynb файл кода и файл прогнозов для тестового множества в формате - как указано в файле. | ||
Помощь по заданию: | Помощь по заданию: |
Версия 17:33, 18 апреля 2016
Содержание
|
Краткое описание
Курс ведется для магистров РЭУ им.Г.В.Плеханова. В курсе рассматриваются основные задачи анализа данных и обучения по прецедентам: классификация, кластеризация, регрессия, понижение размерности, ранжирование, коллаборативная фильрация. По изложению для каждой рассматриваемой задачи изучаются математические основы методов, лежащие в их основе предположения о данных, взаимосвязи методов между собой и особенности их практического применения. Большое внимание уделено освоению практических навыков анализа данных, отрабатываемых на семинарах, которое будет вестись с использованием языка python и соответствующих библиотек для научных вычислений. От студентов требуются знания линейной алгебры, математического анализа и теории вероятностей.
Задания
N1 - Проверка работы метода K-NN
Срок: до 14 февраля.
N2 - Применение метода K-NN для распознавания цифр
Срок: до 14 февраля.
N3 - Поиск наилучшей модели для оценки съедобности грибов
Срок: до 24 апреля.
Необходимо: разработать модель, дающую 100% точность на кросс-валидации и отослать мне ipynb файл кода и файл прогнозов для тестового множества в формате - как указано в файле.
Помощь по заданию:
Пример преобразования признаков и подбора параметров модели для другого датасета.
Для работы демонстрационного примера и выполнения задания понадобятся полезные модули отсюда. Главным образом - модуль feature transformations.py, содержащий one-hot и вероятностное кодирование признаков.
N4 - Предсказание, откликнется ли клиент на новую услугу банка
Помощь по заданию:
Пример преобразования признаков и подбора параметров модели для другого датасета.
Для работы демонстрационного примера и выполнения задания понадобятся полезные модули отсюда. Главным образом - модуль feature transformations.py, содержащий one-hot и вероятностное кодирование признаков.
N5 - Определение зарплаты по описанию вакансии в интернете
Срок: до 15 мая.
Успеваемость
Лекции
Туториалы
Полезные ссылки
Машинное обучение
- machinelearning.ru
- Видеолекции курса К.В.Воронцова по машинному обучению
- Одна из классических и наиболее полных книг по машинному обучению. Elements of Statistical Learning (Trevor Hastie, Robert Tibshirani, Jerome Friedman)
Python
- Официальный сайт
- Библиотеки: NumPy, Pandas, SciKit-Learn, Matplotlib.
- Небольшой пример для начинающих: краткое руководство с примерами по Python 2