Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 174, весна 2014

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Домашнее задание-2: пробное программирование)
Строка 372: Строка 372:
|-
|-
|Дан временной ряд [[Временной ряд (библиотека примеров)|(см. библиотеку)]]. По его вариационному ряду построить гистограмму из <tex>n</tex> перцентилей, нарисовать ее. Какое значение временного ряда встречается чаще всего?
|Дан временной ряд [[Временной ряд (библиотека примеров)|(см. библиотеку)]]. По его вариационному ряду построить гистограмму из <tex>n</tex> перцентилей, нарисовать ее. Какое значение временного ряда встречается чаще всего?
-
|
+
|Гиззатуллин Анвар
|19
|19
|-
|-

Версия 11:16, 26 февраля 2014


Студенты МФТИ 2-го курса, желающие принять участие в проектах 3-го курса, пишите strjov@ccas.ru. Желающие принять участие в проекте "Сложность прогностических моделей" - ссылка будет в течение следующей недели.


Роли

Студент третьего курса очень хочет научиться ставить задачи формально, находить нужную литературу, порождать новые и актуальные идеи и решения задач.

Консультант помогает студенту в пользовании инструментами, отвечает на вопросы по специальности, консультирует выполнение работ, оперативно реагирует на проблемы, проверяет (в среду) результаты, ставит оценки. Предполагается, что консультант сам пишет работу-спутник по этой теме. В конце работы могут быть объединены или выполнены и опубликованы параллельно. По возможности, рекомендуется организовать правки текста студента с целью улучшить стиль изложения таким образом, чтобы студент вносил правки самостоятельно. Возможно, при очной встрече или по скайпу.

Эксперт: поставщик задачи, владелец данных, либо тот, кто гарантирует новизну и актуальность работы.

Результаты

Автор Тема научной работы Ссылка Консультант ДЗ-1 Буквы Оценка
Авдюхов Дмитрий \frac{12}{15}+\frac{3}{16}
Бунаков Василий 0+0
Газизуллина Римма \frac{15}{15}+\frac{10}{16}
Гринчук Алексей \frac{7}{15}+\frac{2}{16}
Гущин Александр \frac{5}{15}+\frac{2}{16}
Ефимова Ирина \frac{15}{15}+\frac{12}{16}
Жуков Андрей \frac{8}{15}+0
Игнатов Андрей \frac{12}{15}+\frac{3}{16}
Карасиков Михаил 0+0
Костюк Анна \frac{12}{15}+\frac{4}{16}
Кулунчаков Андрей \frac{10}{15}+\frac{14}{16}
Липатова Анна \frac{8}{15}+\frac{6}{16}
Макарова Анастасия 0+0
Плавин Александр \frac{13}{15}+\frac{14}{16}
Попова Мария \frac{11}{15}+\frac{6}{16}
Швец Михаил \frac{11}{15}+\frac{4}{16}
Шинкевич Михаил \frac{15}{15}+\frac{9}{16}
Гиззатуллин Анвар 0+0

Расписание

Дата ДЗ Тема лекции Результат для обсуждения Код
Февраль 13 Вводная лекция. Задано ДЗ-1. --
20 1 Начало, демонстрация интерфейсов. Выбор задачи пробного программирования Регистрация в ML и SF, установлены все необходимые инструменты, прочитаны вводные тексты. --
Дата ДЗ Что делаем Результат для обсуждения Код
27 2 Решить пробную задачу, написать код. Выбор задачи Пробный код написан и загружен в репозиторий вместе с иллюстрирующими рисунками. Тема в ML и ссылка на работу в SF помещена напротив фамилии. Test
Март 6 3 Составить список публикаций по выбранной задаче, найти данные. Написать аннотацию и введение с обзором собранной литературы. Аннотация (600 знаков), введение (1-2 страницы), список литературы в bib-файле. Annotation, Introduction, Literature
13 4 Поставить задачу и базовый вычислительный эксперимент. Провести первичный анализ работы алгоритма. Постановка задачи (0,5 страницы), код, отчет о работе базового алгоритма (0.5 — 1 страница). Statement, Basic code, Report
20 5 Поставить вычислительный эксперимент на основе предлагаемого алгоритма с учетом предыдущих результатов. Код, визуализация данных и алгоритма. Code, Visualization
27 6 Описание алгоритма. Алгоритмическая часть статьи (второй / третий раздел). Theory
Апрель 3 7 Описание теоретической части и вычислительного эксперимента. Описание рисунков, выводы, заключение. Черновой вариант статьи с разделами «Вычислительный экперимент» и «Заключение». Document
10 8 Завершение вычислительного эксперимента. Описание эксперимента с анализом ошибок. Error
17 8 Контрольная точка — показ статьи в целом. Доработанная статья. сHeck
24 9 Доклады и обсуждение. Статья подана в журнал. Show, Journal

Работа и консультации

  1. Работы сдаются в течение недели.
  2. Желательна итеративная сдача работ, начинать показ лучше в выходные.
  3. Дедлайн последней версии работы: среда 6:00am (проверка занимает всю среду).
  4. В отчет будет добавлен пункт об учете времени, затраченном на выполнение проекта по неделям.
  5. Каждый этап работ + 1 балл по системе (А--, А-, А, А+, А++). Несделанная работа — 0. Мотивированный перенос работы — знак «>».

Задачи

Шаблон описания научной статьи

  • Название: Название, под которым статья подается в журнал.
  • Задача: Описание или постановка задачи. Желательна постановка в виде задачи оптимизации (в формате argmin). Также возможна ссылка на классическую постановку задачи.
  • Данные: Краткое описание данных, используемых в вычислительном эксперименте, и ссылка на выборку.
  • Литература: Список научных работ, дополненный 1) формулировкой решаемой задачи, 2) ссылками на новые результаты, 3) основной информацией об исследуемой проблеме.
  • Базовой алгоритм: Ссылка на алгоритм, с которым проводится сравнение или на ближайшую по теме работу.
  • Решение: Предлагаемое решение задачи и способы проведения исследования. Способы представления и визуализации данных и проведения анализа ошибок, анализа качества алгоритма.
  • Новизна: Обоснование новизны и значимости идей (для редколлегии и рецензентов журнала).

Домашнее задание-2: пробное программирование

Задача Кто делает Номер
Дана выборка "Вина различных регионов". Требуется определить кластеры (регионы происхождения вин) и нарисовать результат: цветной точкой обозначен объект кластера; цветным кружком обозначен класс этого объекта, взятый из выборки. Вариант задания: определить число кластеров. Вариант задания: использовать два алгоритма, например k-means и EM, и показать сравнение результатов кластеризации на графике. Плавин 1
Предложить способы визуализации наборов четырехмерных векторов, например для Fisher's iris data. Записать свою фамилию тут. 2
Дан временной ряд, описывающий потребление электричества. Приблизить ряд несколькими криволинейными моделями и нарисовать спрогнозированные и исходный ряды на одном графике. Кулунчаков Андрей. 3
Сгладить временной ряд Цены (объемы) на основные биржевые инструменты методом экспоненциального сглаживания. Нарисовать цветные графики сглаженных с различным  \alpha рядов и исходного ряда. Авдюхов 4
Аппроксимация выборки замкнутой кривой [1]: проверить, лежат ли точки на окружности? Сгенерировать данные самостоятельно. Газизуллина Римма 5
Дан временной ряд с пропусками, например [2]. Предложить способы заполнения пропусков в данных, заполнить пропуски. Для каждого способа построить гистограмму. Вариант: взять выборку без пропусков, удалить случайным образом часть данных, заполнить пропуски, сравнить с гистограммой исходной выборки. Игнатов Андрей 6
Дана выборка "Вина различных регионов". Выбрать два признака. Рассмотреть различные функции расстояния при классификации с помощью метода ближайшего соседа. Для каждой изобразить результат классификации в пространстве выбранных признаков. Попова Мария 7
Для различных видов зависимости  y = f(x) + \epsilon (линейная, квадратичная, логарифмическая) построить линейную регрессию и нарисовать на графике SSE-отклонения (среднеквадратичные отклонения-?). Данные сгенерировать самостоятельно или взять данные "Цена на хлеб". Ефимова Ирина 8
Оценить площадь единичного круга методом Монте-Карло. Построить график зависимости результата от размера выборки. Шинкевич Михаил 9
Построить выпуклую оболочку точек на плоскости. Нарисовать график: точки и их выпуклая оболочка – замкнутая ломаная линия. Макарова Анастасия 10
Дана выборка: ирисы Фишера. Реализовать процедуру классификации методом решающего дерева. Проиллюстрировать результаты классификации на плоскости в пространстве двух признаков. Жуков Андрей 11
Задан временной ряд – объемы почасового потребления электроэнергии (выбрать любые два дня). Аппроксимировать ряд полиномиальными моделями различных степеней (1-7). *Предложить метод определения оптимальной степени полинома. Карасиков Михаил 12
Задано два одномерных временных ряда различной длины. Вычислить расстояние между рядами методом динамического выравнивания. Гринчук Алексей 13
Сгенерировать набор точек на плоскости. Выделить и визуализировать главные компоненты. Липатова 14
Аппроксимировать выборку цены на хлеб полиномиальной моделью. Нарисовать график. Пометить объекты, являющиеся выбросами, используя правило трех сигм. Швец Михаил 15
Разделить выборку ирисы Фишера на кластеры. Проиллюстрировать на графике результаты кластеризации, выделить кластеры разными цветами. Гущин Александр 16
И еще задания на выбор
Дана выборка из нескольких признаков, без целевого вектора Y. Например, эта https://dmba.svn.sourceforge.net/svnroot/dmba/Data/Diabets_LARS.csv Требуется указать тот признак, который хорошо описывается (в терминах линейной регрессии) остальными (такой признак обычно исключают из выборки). 17
Сгладить временной ряд (см. библиотеку) скользящим средним. Взять несколько окон разной длины и наложить результат на графике друг на друга. Костюк 18
Дан временной ряд (см. библиотеку). По его вариационному ряду построить гистограмму из n перцентилей, нарисовать ее. Какое значение временного ряда встречается чаще всего? Гиззатуллин Анвар 19
Показать разницу в скорости выполнения матричных операций и операций в цикле. Можно использовать в качестве примера Сингулярное разложение и другие методы линейной алгебры. Показать эффективность параллельных вычислений (parfor). 20
Разобраться как работает суперпозиция функций. С помощью функции @ породить все возможные полиномы от n переменных степени не более p. Вариант: приблизить полученными полиномами временной ряд цен на хлеб (данные).
Личные инструменты