Спецкурс «Прикладные задачи анализа данных»
Материал из MachineLearning.
(→Слушатели) |
(→Слушатели) |
||
Строка 24: | Строка 24: | ||
{{notice| | {{notice| | ||
- | + | Рассылки материалов делаются только зарегистрированным пользователям, которые перечислены в таблице (см. ниже). | |
+ | Слушатели, которые перестают делать домашние задания, удаляются из таблицы. | ||
+ | За каждое задание можно получить от 0 до 10 штрафных баллов. 10 штрафных баллов понижают итоговую оценку на один балл. | ||
+ | |||
+ | Условные обозначения: | ||
+ | |||
+ | '''LB''' - есть в таблице конкурса (при конкурсном задании), | ||
+ | '''LB-k''' - занято высокое k-е место (среди слушателей спецкурса), | ||
+ | '''+r''' - сдан отчёт. | ||
+ | |||
}} | }} | ||
Версия 12:23, 5 октября 2013
Содержание |
Объявление
Спецкурс начал работу 16 сентября (понедельник) в 16:20 (5я пара).
Лектор: Дьяконов Александр
Важно! Для участия в спецкурсе необходимо было зарегистрироваться.
Сейчас регистрация уже закрыта. Желающие прослушать спецкурс могут дождаться следующего года. |
Основная цель: практика решения современных задач классификации, прогнозирования, регрессии, рекомендации и т.п., подготовка участников к соревнованиям на платформах Kaggle и Algomost.
Мероприятие проходит в двух режимах:
- спецкурса – лекции о решении прикладных задач, обучение некоторым системам анализа данных (например R) и т.п.
- спецсеминара – обсуждение решаемых задач, выработка общих стратегий, разделение работы в рамках участия в соревновании одной командой, мозговой штурм и т.п.
Важно: от участников потребуется выполнение нетривиальных практических заданий!
Слушатели
ФИО | рег | задание 1 | задание 2 | задание 3 |
---|---|---|---|---|
Файзи Вахиб | маг | LB | ||
Рыжков Александр Михайлович | 417 | LB | ||
Oleg Kharatsidi | 417 | LB | ||
Шаповалов Никита Анатольевич | 201 | LB | ||
Адимов Арсений Владимирович | 205 | LB | ||
Рысьмятова Анастасия Александровна | 214 | LB | ||
Тавыриков Юрий Евгеньевич | 205 | LB-2 | ||
Трофимов Михаил Игоревич | МФТИ4 | LB | ||
Шадриков Андрей | 417 | LB | ||
Кульпинов Владимир Константинович | 202 | LB | ||
Бырдин Александр Владимирович | МФТИ4 | LB-3 | ||
Кудрявцев Георгий Алексеевич | 206 | LB-1 | ||
Софиюк Константин Сергеевич | 206 | LB | ||
Долганов Станислав Викторович | 206 | LB | ||
Тихонов Глеб Николаевич | 513 | LB | ||
Купляков Денис | 203 | LB | ||
Зак Евгений | 507 | LB | ||
Шабашев Фёдор Маркович | 417 | LB | ||
Ломов Никита | 417 | LB | ||
Алёшин Илья | 417 | LB | ||
Славнов Константин Анатольевич | 317 | LB | ||
Гавриков Михаил Игоревич | 517 | --- | ||
Чепарухин Сергей Игоревич | 214 | --- | ||
Ромов Петр Алексеевич | 517 | --- | ||
Фонарев Александр Юрьевич | 517 | --- | ||
Дорофеев Николай Юрьевич | Яндекс | --- | ||
Федорова Дарья Дмитриевна | ВМК2 | --- | ||
Чабаненко Владислав Дмитриевич | 204 | --- | ||
Игнатов Алексей Николаевич | 416 | --- | ||
Каледин Станислав Витальевич | МФТИ4 | --- | ||
Шевцова Алена | ВМКвып | --- |
Лекции
Число | Лекция | Материалы, замечания |
---|---|---|
16.09.13 | Решение задачи [The Big Data Combine Engineered by BattleFin] - прогноз цены на основе многомерного ряда и анонимизированных признаков. Загрузка данных, простые модели, линейная регрессия и случайный лес, сравнение R и MATLAB. | Домашнее задание: решить задачу (отчёт). Материалы см. в [ветке форума] соревнования. |
07.10.13 | Разбор первого домашнего задания. |
Аннотация
2do
Автор программы: Дьяконов Александр Геннадьевич
Отчётность
- отчёты по решению конкурсных задач (доклады с презентацией + исходники)
- зачёт с оценкой в конце семестра
Ссылки
Вводная лекция, которая написана для просеминара.
Глава 12 «Шаманство в анализе данных».
Переработка предыдущего источника в научно-популярную лекцию.
Рассказываются тонкости решения задач, которые умалчиваются в основных курсах.
Подробное описание некоторых простых алгоритмов для прогнозирования туристических временных рядов.
- Страница спецсеминара «Алгебра над алгоритмами и эвристический поиск закономерностей»
Приведены ссылки на сайты с данными реальных задач анализа данных.
Ещё ссылки
Неплохая короткая демка про соревнования в анализе данных, платформы для соревнований и возможности системы R.