Спецкурс «Прикладные задачи анализа данных»
Материал из MachineLearning.
Содержание |
Объявление
Объявлен набор слушателей на спецкурс (5 сентября 2014 года).
Необходима регистрация! Для этого надо прислать на почту djakonov (собака) mail (точка) ru Тема письма: [ПЗАД] Фамилия студента Текст: в первой строке через точку с запятой указываются
В других строчках (начиная со второй) можно по желанию дать пояснения. Пример:
Посещение спецкурса закрытое, число мест ограничено, регистрация скоро будет закрыта – спешите… |
УЖЕ ЗАПИСАЛИСЬ | группа | регистрация |
---|---|---|
Семёнов Станислав Георгиевич | ВШЭ | 05.09 |
Арбузова Дарья Андреевна | 517 | 05.09 |
Гущин Александр Евгеньевич | МФТИ | 05.09 |
Потапенко Анна Александровна | 617 | 06.09 |
Фенстер Александра Михайловна | НИУ ВШЭ 172мАИД | 06.09 |
Вихрева Мария Викторовна | 315 | 06.09 |
Бахтин Антон Вячеславович | МГУ, Яндекс | 06.09 |
Ульянов Дмитрий Владимирович | 517 | 07.09 |
Шапулин Андрей Валентинович | 417 | 07.09 |
Сиверский Михаил Николаевич | физфак | 09.09 |
Игнатов Алексей Николаевич | 516 | 11.09 |
Сокурский Юрий Валентинович | 517 | 12.09 |
Дойков Никита Владимирович | 417 | 14.09 |
Лукашкина Юлия Николаевна | 417 | 15.09 |
Байбурин Валерий Тагирович | м118; | 15.09 |
Дымов Григорий Андреевич | Stockholm university | 16.09 |
Чинаев Николай Николаевич | МФТИ | 17.09 |
ДОВОДИМАЯ РАНЕЕ ИНФОРМАЦИЯ: В сентябре 2014 года будет объявлен новый набор слушателей спецкурса.
Поскольку обычно желающих очень много, а работа на спецкурсе подразумевает сильную вовлечённость студентов и небольшое число слушателей, то будет произведён отбор.
Для участия в отборе необходимо:
- освоить (если его не было в учебной программе) курс Машинное обучение,
- выступить хотя бы в одном соревновании по анализу данных (см. ниже),
- Пройти анкетирование (или собеседование в сентябре).
Список допустимых соревнований:
- Display Advertising Challenge
- Liberty Mutual Group - Fire Peril Loss Cost завершён
- The Hunt for Prohibited Content завершён
- Higgs Boson Machine Learning Challenge
- ecMeg2014 - Decoding the Human Brain завершён
- Detect seizures in intracranial EEG recordings завершён
- KDD Cup 2014 - Predicting Excitement at DonorsChoose.org завершён
- Acquire Valued Shoppers Challenge завершён
- Greek Media Monitoring Multilabel Classification (WISE 2014) завершён
Результат будет учитываться при отборе. Участие в соревновании не гарантирует отбор!
В новой версии спецкурса будет серия лекций по системам Matlab и R.
Кроме того, будут рассмотрены новые темы: например, анализ соцсетей.
Аннотация
Данный курс стал победителем конкурса инновационных учебных технологий. |
Основная цель: практика решения современных задач классификации, прогнозирования, регрессии, рекомендации и т.п., подготовка участников к соревнованиям на платформах Kaggle и Algomost.
Мероприятие проходит в двух режимах:
- спецкурса – лекции о решении прикладных задач, обучение некоторым системам анализа данных (например R, Matlab, Python+ и т.п.
- спецсеминара – обсуждение решаемых задач, выработка общих стратегий, разделение работы в рамках участия в соревновании одной командой, мозговой штурм и т.п.
Важно: от участников потребуется выполнение нетривиальных практических заданий!
Лектор: Дьяконов Александр
Страницы курсов прошлых лет
Спецкурс «Прикладные задачи анализа данных» (2013 год)
Правила
- Рассылки материалов делаются только зарегистрированным слушателям курса (перечислены в таблице слушателей).
- Слушатели, которые перестают делать домашние задания, удаляются из таблицы.
Лекции
Здесь будет выложена программа нового (2014 года) - по мере чтения курса.
Старую программу см. на странице Спецкурс «Прикладные задачи анализа данных» (2013 год).
Отчётность
- отчёты по решению конкурсных задач (доклады с презентацией + исходники)
- зачёт с оценкой в конце семестра
Ссылки
Вводная лекция, которая написана для просеминара.
Глава 12 «Шаманство в анализе данных».
Переработка предыдущего источника в научно-популярную лекцию.
Рассказываются тонкости решения задач, которые умалчиваются в основных курсах.
Подробное описание некоторых простых алгоритмов для прогнозирования туристических временных рядов.
- Страница спецсеминара «Алгебра над алгоритмами и эвристический поиск закономерностей»
Приведены ссылки на сайты с данными реальных задач анализа данных.
Ещё ссылки
Неплохая короткая демка про соревнования в анализе данных, платформы для соревнований и возможности системы R.