Практикум на ЭВМ (317)/2011-2012
Материал из MachineLearning.
(30 промежуточных версий не показаны.) | |||
Строка 7: | Строка 7: | ||
= Последние новости = | = Последние новости = | ||
+ | |||
{{tip| | {{tip| | ||
- | + | Для тех, кто не сдал задачу '''5 мая''' | |
+ | добавлены файлы с заданием (теперь они доступны для скачивания)! | ||
}} | }} | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
+ | {{tip| | ||
+ | Сдача задания по модельной задаче (презентация исследований) состоится '''5 мая'''. | ||
+ | Необходимо до этого числа (!) прислать файл ''' [''Имя файла с задачей'']z.mat ''' (пример имени файла: mat317n21trainz.mat), | ||
+ | в котором содержатся 2 переменные: '''ANS''' (вектор-столбец с ответами для всех объектов), | ||
+ | '''FEAT''' (логическая вектор-строка с пометками существенных признаков). | ||
+ | Если задача решена не в Матлабе и ответ не может быть переконвертирован в нужный формат, | ||
+ | присылаются два txt-файла ''' [''Имя файла с задачей'']ANS.txt ''', ''' [''Имя файла с задачей'']FEAT.txt '''. | ||
+ | }} | ||
= Задания 2012 года (весна) = | = Задания 2012 года (весна) = | ||
+ | * Модельные задачи. [[Media:z2012v-2.pdf| '''Постановка задачи и перечень модельных задач''']] | ||
+ | * Работа с пакетом [http://cran.gis-lab.info/ R] | ||
+ | ** [http://alexanderdyakonov.narod.ru/upR.pdf Базовые команды системы R] '''пособие находится в стадии постоянной правки''' | ||
+ | ** Задание: сделать обзор одного из пакетов системы [http://cran.gis-lab.info/ R]. [http://cran.gis-lab.info/web/views/ Здесь] находится список пакетов "по тематикам". Предпочтителен выбор пакетов из категории [http://cran.gis-lab.info/web/views/MachineLearning.html Machine Learning]. '''Выложить отчёт на вкладку "обсуждение" до 23 апреля 2012 года.''' | ||
+ | * Работа с пакетами [http://www.cs.waikato.ac.nz/~ml/weka/ Weka] и [http://www.rapidminer.com/ RapidMiner] | ||
+ | ** Необходимо до '''16:20 19 марта 2012 года''' предоставить отчёт о решении задачи анализа данных в этих системах (с описанием задачи, действий по решению, результатов, приложениями скрин-сейвов, выводами). Отчёт принимается в форматах ''doc, rtf, pdf, ps''. | ||
+ | ** [[Media:Mtx12.zip| Файлы для тестов в классе]] | ||
* Решение реальной задачи [http://tunedit.org/challenge/JRS12Contest «Topical Classification of Biomedical Research Papers»] | * Решение реальной задачи [http://tunedit.org/challenge/JRS12Contest «Topical Classification of Biomedical Research Papers»] | ||
+ | ** [[Media:Z2012sp-1.doc| «Постановка задачи»]] | ||
+ | ** '''ВАЖНО''' При регистрации на [http://tunedit.org] в названии команды должна присутствовать Ваша фамилия! | ||
+ | ** Работа по заданию происходит на вкладке [http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:%D0%9F%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D0%BA%D1%83%D0%BC_%D0%BD%D0%B0_%D0%AD%D0%92%D0%9C_%28317%29 обсуждение]. | ||
+ | ** По условию конкурса необходимо предоставить краткий отчёт организаторам! Без него команда выбывает из соревнования. Возможно, это повлечёт удаление из рейтинга, за который студенты также получают баллы по этому заданию. | ||
+ | ** Отчёт (см. [[Media:z2012v-1.pdf| требования к отчёту]]) должен быть выложен на вкладку [http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:%D0%9F%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D0%BA%D1%83%D0%BC_%D0%BD%D0%B0_%D0%AD%D0%92%D0%9C_%28317%29 обсуждение] до '''16:05''' 9 апреля 2012 года. | ||
= Задания 2011 года (осень) = | = Задания 2011 года (осень) = | ||
Строка 78: | Строка 91: | ||
* Заключение (не обязательно оформлять в виде отдельного раздела) | * Заключение (не обязательно оформлять в виде отдельного раздела) | ||
''Выводы, сделанные для себя. Ответ на вопрос «Если бы у меня было больше времени…», ожидаемый результат. Возможности улучшения Вашего алгоритма. Советы «новичкам».'' | ''Выводы, сделанные для себя. Ответ на вопрос «Если бы у меня было больше времени…», ожидаемый результат. Возможности улучшения Вашего алгоритма. Советы «новичкам».'' | ||
+ | |||
+ | [[Категория:Кафедра Математические методы прогнозирования ВМиК МГУ]] | ||
+ | [[Категория:Учебные практикумы]] |
Текущая версия
|
- Обязательный курс для студентов каф. ММП 3 курса, 5-6 семестр.
- Зачёт с оценкой
- Семинарист: А. Г. Дьяконов
- Учебное пособие: Анализ данных, обучение по прецедентам, логические игры, системы WEKA, RapidMiner и MatLab (практикум на ЭВМ кафедры математических методов прогнозирования).
Последние новости
Для тех, кто не сдал задачу 5 мая
добавлены файлы с заданием (теперь они доступны для скачивания)! |
Задания 2012 года (весна)
- Модельные задачи. Постановка задачи и перечень модельных задач
- Работа с пакетом R
- Базовые команды системы R пособие находится в стадии постоянной правки
- Задание: сделать обзор одного из пакетов системы R. Здесь находится список пакетов "по тематикам". Предпочтителен выбор пакетов из категории Machine Learning. Выложить отчёт на вкладку "обсуждение" до 23 апреля 2012 года.
- Работа с пакетами Weka и RapidMiner
- Необходимо до 16:20 19 марта 2012 года предоставить отчёт о решении задачи анализа данных в этих системах (с описанием задачи, действий по решению, результатов, приложениями скрин-сейвов, выводами). Отчёт принимается в форматах doc, rtf, pdf, ps.
- Файлы для тестов в классе
- Решение реальной задачи «Topical Classification of Biomedical Research Papers»
- «Постановка задачи»
- ВАЖНО При регистрации на [1] в названии команды должна присутствовать Ваша фамилия!
- Работа по заданию происходит на вкладке обсуждение.
- По условию конкурса необходимо предоставить краткий отчёт организаторам! Без него команда выбывает из соревнования. Возможно, это повлечёт удаление из рейтинга, за который студенты также получают баллы по этому заданию.
- Отчёт (см. требования к отчёту) должен быть выложен на вкладку обсуждение до 16:05 9 апреля 2012 года.
Задания 2011 года (осень)
- «Решение реальной задачи»
- «Данные» (2.5Мб-zip-архив) Объекты записаны по строкам в текстовых файлах, первый признак целевой, X1.txt - обучение, X2.txt - контроль.
- К четвергу 15.12.11 надо реализовать в среде MATLAB байесовский классификатор и метрический классификатор. Решить с их помощью реальную задачу. В результате экспериментов выбрать оптимальные параметры алгоритмов (например, тип метрического алгоритма, k, веса и т.п.). Функционал качества - ROC AUC. Написать краткий отчёт (сдача допускается в электронной форме).
- Также студенты к четвергу 15.12.11 представляют вектор ответов реальной задачи (его не обязательно получить методом kNN или байесовским классификатором). По результатам сдачи проводится соревнование (I место - 5 баллов, II - 3, III - 2).
- «Восстановление плотности» (вторая сдача - 24 ноября 2011)
- «Игра» (первая сдача - 6 октября 2011, окончательная сдача - 20 октября 2011)
- «Постановка задачи»
- Первая игра (описание)
- Вторая игра (описание)
- Третья игра (описание)
- Новинка! Игроки (zip-архив) (возможно, не все они корректно играют. К сожалению, были подготовлены в спешке.)
Правила сдачи практикума на ЭВМ для студентов 317 группы
- В течение семестра будет несколько заданий.
- На выполнение каждого задания студентам отводится определённый срок (не меньше 2х недель).
- Задания бывают трёх типов: стандартные, соревновательные и зачёты (по пройденным темам).
- Выполнение каждого задания оценивается некоторым кол-вом баллов (стоимость каждого задания заранее объявляется). При проставлении оценки в конце семестра учитывается сумма набранных баллов (например, ОТЛИЧНО ~ 25 баллов и выше, ХОРОШО ~ от 20 до 24 баллов, УДОВЛЕТВОРИТЕЛЬНО ~ от 15 до 19 баллов).
- Для получения оценки ОТЛИЧНО по практикуму достаточно решения всех стандартных задач и сдачи всех промежуточных зачётов.
- Стандартные задания, в основном, являются заданиями реализации алгоритмов, которые изучаются студентами в курсе ММРО и ПА (в весеннем семестре они все являются таковыми).
- Стандартные задания оцениваются фиксированным кол-ом баллов.
- Сдача этих заданий возможна до определённой даты (позже задания не принимаются).
- Соревновательные задания сдаются в один день! За выполнение такого задания студенты получают символическое кол-во баллов (1-2, часто само выполнение является стандартным заданием). Однако все работы студентов упорядочиваются (критерий упорядочивания заранее оговорен) и лучшие три работы получают "вознаграждения" (например, I место - 5 баллов [с учётом цены задания], II место - 4 балла, III место - 3 балла).
- Все задания принимаются только в машзале и только в часы занятий (см. расписание). Соревновательные задания принимаются только на компьютерах машзала (не на ноутбуках). В крайнем случае, задания могут приниматься на кафедре, но только в часы занятий.
- Задание принимается «за один заход». Преподаватель подходит к студенту, сидящему за компьютером, и принимает задание. Если «что-то не работает», то задание не засчитывается. Преподаватель не ждёт, пока студент исправит задание (исправит настройки, внесёт изменения в листинг и перекомпилирует)! В отдельных случаях разрешается доработать задание тут же в компьютерном классе.
- Если в задание входит написание отчёта, то программа без отчёта не принимается. Отчёт можно сдавать в электронной форме (файл *.doc), если не оговорено противное.
- При сдаче необходим исходный код программы, запускающийся файл (*.exe), отчёт (если требуется).
Требования к отчёту
Обязательные разделы и комментарии:
- Титульный лист
Факультет, кафедра, Ф.И.О. студента, название задания, год выполнения.
- Постановка задачи
Поощряется текстуальное (но не формальное) отличие от официальной постановки.
- Алгоритм решения
Точное чёткое описание.
- Прагматика (не обязательно оформлять в виде отдельного раздела)
ПОЧЕМУ и ЗАЧЕМ выбран именно этот метод решения? Какие есть ещё алгоритмы? Сравнение.
- Примеры работы алгоритма
На модельных и «реальных» задачах. Задачи не должны быть слишком тривиальные.
- Руководство пользователя
Интерфейс работы с программой.
- Руководство программиста
Особенности реализации. Интерфейс встраивания Вашего алгоритма в другие программы. Возможности такого встраивания.
- Список использованной литературы.
Включая ссылки на Web-ресурсы.
- Заключение (не обязательно оформлять в виде отдельного раздела)
Выводы, сделанные для себя. Ответ на вопрос «Если бы у меня было больше времени…», ожидаемый результат. Возможности улучшения Вашего алгоритма. Советы «новичкам».