Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 174, весна 2014
Материал из MachineLearning.
(→Расписание) |
(→Работа и консультации) |
||
Строка 243: | Строка 243: | ||
# Дедлайн последней версии работы: вторник 6:00am (проверка занимает весь вторник). | # Дедлайн последней версии работы: вторник 6:00am (проверка занимает весь вторник). | ||
# В отчет будет добавлен пункт об учете времени, затраченном на выполнение проекта по неделям. | # В отчет будет добавлен пункт об учете времени, затраченном на выполнение проекта по неделям. | ||
- | # Каждый этап работ + 1 балл по системе (А--, А-, А, А+, А++). Несделанная | + | # Каждый этап работ + 1 балл по системе (А--, А-, А, А+, А++). Несделанная работа — 0. Мотивированный перенос работы — знак «>». |
== Задачи == | == Задачи == |
Версия 09:06, 20 февраля 2014
Роли
Студент третьего курса очень хочет научиться ставить задачи формально, находить нужную литературу, порождать новые и актуальные идеи и решения задач.
Консультант помогает студенту в пользовании инструментами, отвечает на вопросы по специальности, консультирует выполнение работ, оперативно реагирует на проблемы, проверяет (в среду) результаты, ставит оценки. Предполагается, что консультант сам пишет работу-спутник по этой теме. В конце работы могут быть объединены или выполнены и опубликованы параллельно. По возможности, рекомендуется организовать правки текста студента с целью улучшить стиль изложения таким образом, чтобы студент вносил правки самостоятельно. Идеально, если это происходит при очной встрече или по скайпу.
Эксперт: поставщик задачи, владелец данных, либо тот, кто гарантирует новизну и актуальность работы.
Результаты
Автор | Тема научной работы | Ссылка | Консультант | Буквы | Оценка |
---|---|---|---|---|---|
Авдюхов Дмитрий | |||||
Газизуллина Римма | |||||
Гринчук Алексей | |||||
Гущин Александр | |||||
Ефимова Ирина | |||||
Жуков Андрей | |||||
Игнатов Андрей | |||||
Карасиков Михаил | |||||
Костюк Анна | |||||
Кулунчаков Андрей | |||||
Липатова Анна | |||||
Макарова Анастасия | |||||
Макарова Анастасия | |||||
Попова Мария | |||||
Швец Михаил | |||||
Шинкевич Михаил | |||||
Гиззатуллин Анвар |
Расписание
Дата | ДЗ | Тема лекции | Результат для обсуждения | Код | |
Февраль | 13 | Вводная лекция. | Задано ДЗ-1. | -- | |
20 | 1 | Начало, демонстрация интерфейсов. Выбор задачи пробного программирования | Регистрация в ML и SF, установлены все необходимые инструменты, прочитаны вводные тексты. | -- | |
Дата | ДЗ | Что делаем | Результат для обсуждения | Код | |
27 | 2 | Решить пробную задачу, написать код. Выбор задачи | Пробный код написан и загружен в репозиторий вместе с иллюстрирующими рисунками. Тема в ML и ссылка на работу в SF помещена напротив фамилии. | Test | |
Март | 6 | 3 | Составить список публикаций по выбранной задаче, найти данные. Написать аннотацию и введение с обзором собранной литературы. | Аннотация (600 знаков), введение (1-2 страницы), список литературы в bib-файле. | Annotation, Introduction, Literature |
13 | 4 | Поставить задачу и базовый вычислительный эксперимент. Провести первичный анализ работы алгоритма. | Постановка задачи (0,5 страницы), код, отчет о работе базового алгоритма (0.5 — 1 страница). | Statement, Basic code, Report | |
20 | 5 | Поставить вычислительный эксперимент на основе предлагаемого алгоритма с учетом предыдущих результатов. | Код, визуализация данных и алгоритма. | Code, Visualization | |
27 | 6 | Описание алгоритма. | Алгоритмическая часть статьи (второй / третий раздел). | Theory | |
Апрель | 3 | 7 | Описание теоретической части и вычислительного эксперимента. Описание рисунков, выводы, заключение. | Черновой вариант статьи с разделами «Вычислительный экперимент» и «Заключение». | Document |
10 | 8 | Завершение вычислительного эксперимента. | Описание эксперимента с анализом ошибок. | Error | |
17 | 8 | Контрольная точка — показ статьи в целом. | Доработанная статья. | сHeck | |
24 | 9 | Доклады и обсуждение. | Статья подана в журнал. | Show, Journal |
Работа и консультации
- Работы сдаются в течение недели.
- Желательна итеративная сдача работ, начинать показ лучше в выходные.
- Дедлайн последней версии работы: вторник 6:00am (проверка занимает весь вторник).
- В отчет будет добавлен пункт об учете времени, затраченном на выполнение проекта по неделям.
- Каждый этап работ + 1 балл по системе (А--, А-, А, А+, А++). Несделанная работа — 0. Мотивированный перенос работы — знак «>».
Задачи
Шаблон описания научной статьи
- Название: Название, под которым статья подается в журнал.
- Задача: Описание или постановка задачи. Желательна постановка в виде задачи оптимизации (в формате argmin). Также возможна ссылка на классическую постановку задачи.
- Данные: Краткое описание данных, используемых в вычислительном эксперименте, и ссылка на выборку.
- Литература: Список научных работ, дополненный 1) формулировкой решаемой задачи, 2) ссылками на новые результаты, 3) основной информацией об исследуемой проблеме.
- Базовой алгоритм: Ссылка на алгоритм, с которым проводится сравнение или на ближайшую по теме работу.
- Решение: Предлагаемое решение задачи и способы проведения исследования. Способы представления и визуализации данных и проведения анализа ошибок, анализа качества алгоритма.
- Новизна: Обоснование новизны и значимости идей (для редколлегии и рецензентов журнала).
Домашнее задание-2: пробное программирование
Пока тут одно задание, помещенное по запросу. Остальные будут в четверг, 20.02. |
Задача | Кто делает |
---|---|
Дана выборка "Вина различных регионов". Требуется определить кластеры (регионы происхождения вин) и нарисовать результат: цветной точкой обозначен объект кластера; цветным кружком обозначен класс этого объекта, взятый из выборки. Вариант задания: определить число кластеров. Вариант задания: использовать два алгоритма, например k-means и EM, и показать сравнение результатов кластеризации на графике. | Записать свою фамилию тут. |
Предложить способы визуализации наборов четырехмерных векторов, например для Fisher's iris data. | Записать свою фамилию тут. |
Дан временной ряд, описывающий потребление электричества. Приблизить ряд несколькими криволинейными моделями и нарисовать спрогнозированные и исходный ряды на одном графике. | Записать свою фамилию тут. |
Сгладить временной ряд Цены (объемы) на основные биржевые инструменты методом экспоненциального сглаживания. Нарисовать цветные графики сглаженных с различным рядов и исходного ряда. | Фамилия! |
Аппроксимация выборки замкнутой кривой [1]: проверить, лежат ли точки на окружности? Сгенерировать данные самостоятельно. | Записать свою фамилию тут. |
Дан временной ряд с пропусками, например [2]. Предложить способы заполнения пропусков в данных, заполнить пропуски. Для каждого способа построить гистограмму. Вариант: взять выборку без пропусков, удалить случайным образом часть данных, заполнить пропуски, сравнить с гистограммой исходной выборки. | Записать свою фамилию тут. |
Дана выборка "Вина различных регионов". Выбрать два признака. Рассмотреть различные функции расстояния при классификации с помощью метода ближайшего соседа. Для каждой изобразить результат классификации в пространстве выбранных признаков. | Фамилия. |
Для различных видов зависимости (линейная, квадратичная, логарифмическая) построить линейную регрессию и нарисовать на графике SSE-отклонения (среднеквадратичные отклонения-?). Данные сгенерировать самостоятельно или взять данные "Цена на хлеб". | |
Оценить площадь единичного круга методом Монте-Карло. Построить график зависимости результата от размера выборки. | |
Построить выпуклую оболочку точек на плоскости. Нарисовать график: точки и их выпуклая оболочка – замкнутая ломаная линия. | |
Дана выборка: ирисы Фишера. Реализовать процедуру классификации методом решающего дерева. Проиллюстрировать результаты классификации на плоскости в пространстве двух признаков. | |
Задан временной ряд – объемы почасового потребления электроэнергии (выбрать любые два дня). Аппроксимировать ряд полиномиальными моделями различных степеней (1-7). *Предложить метод определения оптимальной степени полинома. | |
Задано два одномерных временных ряда различной длины. Вычислить расстояние между рядами методом динамического выравнивания. | |
Сгенерировать набор точек на плоскости. Выделить и визуализировать главные компоненты. | |
Аппроксимировать выборку цены на хлеб полиномиальной моделью. Нарисовать график. Пометить объекты, являющиеся выбросами, используя правило трех сигм. | |
Разделить выборку ирисы Фишера на кластеры. Проиллюстрировать на графике результаты кластеризации, выделить кластеры разными цветами. |