Спецкурс «Прикладные задачи анализа данных»
Материал из MachineLearning.
(→Слушатели) |
(→Слушатели) |
||
Строка 64: | Строка 64: | ||
| 201 | | 201 | ||
| LB+r | | LB+r | ||
+ | | {-10} | ||
| | | | ||
- | | | + | | -10 |
- | + | ||
|- | |- | ||
| Адимов Арсений Владимирович | | Адимов Арсений Владимирович | ||
| 205 | | 205 | ||
| LB+r | | LB+r | ||
+ | | {-10} | ||
| | | | ||
- | | | + | | -10 |
- | + | ||
|- | |- | ||
| Рысьмятова Анастасия Александровна | | Рысьмятова Анастасия Александровна | ||
Строка 92: | Строка 92: | ||
| МФТИ4 | | МФТИ4 | ||
| LB+r | | LB+r | ||
+ | | {-10} | ||
| | | | ||
- | | | + | | -10 |
- | + | ||
|- | |- | ||
| Шадриков Андрей | | Шадриков Андрей | ||
Строка 141: | Строка 141: | ||
| 417 | | 417 | ||
| LB+r | | LB+r | ||
+ | | {-10} | ||
| | | | ||
- | | | + | | -10 |
- | + | ||
|- | |- | ||
| Ломов Никита | | Ломов Никита | ||
Строка 169: | Строка 169: | ||
| ВМКвып | | ВМКвып | ||
| LB+r | | LB+r | ||
+ | | {-10} | ||
| | | | ||
- | | | + | | -10 |
- | + | ||
|- | |- | ||
| Гавриков Михаил Игоревич | | Гавриков Михаил Игоревич | ||
Строка 182: | Строка 182: | ||
| Ромов Петр Алексеевич | | Ромов Петр Алексеевич | ||
| 517 | | 517 | ||
+ | | {-10} | ||
| {-10} | | {-10} | ||
| | | | ||
- | + | | -20 | |
- | | - | + | |
|- | |- | ||
| Фонарев Александр Юрьевич | | Фонарев Александр Юрьевич | ||
Строка 196: | Строка 196: | ||
| Дорофеев Николай Юрьевич | | Дорофеев Николай Юрьевич | ||
| Яндекс | | Яндекс | ||
+ | | {-10} | ||
| {-10} | | {-10} | ||
| | | | ||
- | + | | -20 | |
- | | - | + | |
|- | |- | ||
| Игнатов Алексей Николаевич | | Игнатов Алексей Николаевич | ||
| 416 | | 416 | ||
| +r {-3} | | +r {-3} | ||
+ | | {-10} | ||
| | | | ||
- | + | | -13 | |
- | | - | + | |
|- | |- | ||
| Файзи Вахиб | | Файзи Вахиб |
Версия 09:01, 30 октября 2013
Содержание |
Объявление
Спецкурс начал работу 16 сентября (понедельник) в 16:20 (5я пара).
Лектор: Дьяконов Александр
Важно! Для участия в спецкурсе необходимо было зарегистрироваться.
Сейчас регистрация уже закрыта. Желающие прослушать спецкурс могут дождаться следующего года. |
Основная цель: практика решения современных задач классификации, прогнозирования, регрессии, рекомендации и т.п., подготовка участников к соревнованиям на платформах Kaggle и Algomost.
Мероприятие проходит в двух режимах:
- спецкурса – лекции о решении прикладных задач, обучение некоторым системам анализа данных (например R) и т.п.
- спецсеминара – обсуждение решаемых задач, выработка общих стратегий, разделение работы в рамках участия в соревновании одной командой, мозговой штурм и т.п.
Важно: от участников потребуется выполнение нетривиальных практических заданий!
Слушатели
ФИО | рег | задание 1 | задание 2 (в проверке) | задание 3 | штраф(сумма на 26.10) |
---|---|---|---|---|---|
Рыжков Александр Михайлович | 417 | LB+r | +r | 0 | |
Харациди Олег | 417 | LB+r | +r | 0 | |
Шаповалов Никита Анатольевич | 201 | LB+r | {-10} | -10 | |
Адимов Арсений Владимирович | 205 | LB+r | {-10} | -10 | |
Рысьмятова Анастасия Александровна | 214 | LB+r | +r | 0 | |
Тавыриков Юрий Евгеньевич | 205 | LB-2+r | +r | 0 | |
Трофимов Михаил Игоревич | МФТИ4 | LB+r | {-10} | -10 | |
Шадриков Андрей | 417 | LB+r | +r | 0 | |
Кудрявцев Георгий Алексеевич | 206 | LB-1+r | +r | 0 | |
Софиюк Константин Сергеевич | 206 | LB+r | +r | 0 | |
Долганов Станислав Викторович | 206 | LB+r | +r | 0 | |
Тихонов Глеб Николаевич | 513 | LB+r | +r | 0 | |
Купляков Денис | 203 | LB+r | +r | 0 | |
Шабашев Фёдор Маркович | 417 | LB+r | {-10} | -10 | |
Ломов Никита | 417 | LB+r | +r | 0 | |
Алёшин Илья | 417 | LB+r | +r {-1} | -1 | |
Славнов Константин Анатольевич | 317 | LB+r | +r | 0 | |
Шевцова (Подлевских) Алена | ВМКвып | LB+r | {-10} | -10 | |
Гавриков Михаил Игоревич | 517 | +r {-6} | +r | -6 | |
Ромов Петр Алексеевич | 517 | {-10} | {-10} | -20 | |
Фонарев Александр Юрьевич | 517 | +r {-3} | +r | -3 | |
Дорофеев Николай Юрьевич | Яндекс | {-10} | {-10} | -20 | |
Игнатов Алексей Николаевич | 416 | +r {-3} | {-10} | -13 | |
Файзи Вахиб | маг | LB+r | Deleted(30.10) | Deleted | |
Кульпинов Владимир Константинович | 202 | LB {-3} | Deleted(30.10) | Deleted | |
Бырдин Александр Владимирович | МФТИ4 | LB-3 {-3} | Deleted(30.10) | Deleted | |
Зак Евгений | 517 | LB {-3} | Deleted(30.10) | Deleted |
Лекции
Число | Лекция | Материалы, замечания |
---|---|---|
16.09.13 | Решение задачи [The Big Data Combine Engineered by BattleFin] - прогноз цены на основе многомерного ряда и анонимизированных признаков. Загрузка данных, простые модели, линейная регрессия и случайный лес, сравнение R и MATLAB. | Домашнее задание: решить задачу (отчёт). Материалы см. в [ветке форума] соревнования. |
07.10.13 | Разбор первого домашнего задания. Искусство визуализации данных: признаки в задаче [bioresponse], оценка признаков и фолдов, деформация ответов, устойчивость закономерностей, профили лет (в прогнозировании вр.рядов), плотности, оценка качества признаков с помощью RF и удалений | Слайды и материалы высланы по почте участникам. |
14.10.13 | Продолжение Искусство визуализации данных: Результаты алгоритмов и их линейные комбинации, ручная деформация пространств, визуализация и сглаживание плотностей, построение профилей. Что надо знать о признаках. Визуализация по-вертикали и по-горизонтали. Шумы и шумовые признаки. Задачи [cause-effect-pairs], [GiveMeSomeCredit], [DarkWorlds]. Как начать решать второе домашнее задание. | Слайды и материалы высланы по почте участникам. |
21.10.13 | Вторая задача: мозговой штурм. Оценка среднего, оценка вероятности, оценка плотности. Весовые схемы. Задача [dunnhumby]. | |
28.10.13 | Продолжение Оценка плотности. Весовые схемы. Задача [пробки]. Следующая тема: Напоминание: линейные классификаторы и линейная регрессия. |
Аннотация
2do
Автор программы: Дьяконов Александр Геннадьевич
Отчётность
- отчёты по решению конкурсных задач (доклады с презентацией + исходники)
- зачёт с оценкой в конце семестра
Ссылки
Вводная лекция, которая написана для просеминара.
Глава 12 «Шаманство в анализе данных».
Переработка предыдущего источника в научно-популярную лекцию.
Рассказываются тонкости решения задач, которые умалчиваются в основных курсах.
Подробное описание некоторых простых алгоритмов для прогнозирования туристических временных рядов.
- Страница спецсеминара «Алгебра над алгоритмами и эвристический поиск закономерностей»
Приведены ссылки на сайты с данными реальных задач анализа данных.
Ещё ссылки
Неплохая короткая демка про соревнования в анализе данных, платформы для соревнований и возможности системы R.