Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 474, весна 2018
Материал из MachineLearning.
Строка 2: | Строка 2: | ||
__NOTOC__ | __NOTOC__ | ||
- | + | ==Постановка задач в машинном обучении, практические занятия== | |
Курс посвящен технике изложения основной идеи исследования. Обсуждаются постановки задач выбора моделей и способы построения функции ошибки. Обсуждение ведется в формате лекций и эссе. '''Эссе''' — это изложение идеи постановки и решения задачи. Изложение должно быть достаточно полным (идея восстанавливается однозначно), но кратким (полстраницы) и ясным. Задача ставится формально, желательно использование языка теории множеств, алгебры, матстатистики. Желательно ставить задачу в формате argmin. Пишется в свободной форме, с учетом нашего стиля выполнения научных работ: терминологическая точность и единство обозначений приветствуются[http://strijov.com/papers/Katrutsa2014TestGenerationEn.pdf]. Желательно приводить решение задачи в краткой форме. В начале занятия из написанных эссе выбираются эссе для доклада и обсуждения. Продолжительность доклада 3 минуты. Оценка выставляется за устный доклад: A или Z баллов. | Курс посвящен технике изложения основной идеи исследования. Обсуждаются постановки задач выбора моделей и способы построения функции ошибки. Обсуждение ведется в формате лекций и эссе. '''Эссе''' — это изложение идеи постановки и решения задачи. Изложение должно быть достаточно полным (идея восстанавливается однозначно), но кратким (полстраницы) и ясным. Задача ставится формально, желательно использование языка теории множеств, алгебры, матстатистики. Желательно ставить задачу в формате argmin. Пишется в свободной форме, с учетом нашего стиля выполнения научных работ: терминологическая точность и единство обозначений приветствуются[http://strijov.com/papers/Katrutsa2014TestGenerationEn.pdf]. Желательно приводить решение задачи в краткой форме. В начале занятия из написанных эссе выбираются эссе для доклада и обсуждения. Продолжительность доклада 3 минуты. Оценка выставляется за устный доклад: A или Z баллов. | ||
Строка 13: | Строка 13: | ||
* Короткая ссылка на страницу [http://bit.ly/2F9iLgW bit.ly/2F9iLgW] | * Короткая ссылка на страницу [http://bit.ly/2F9iLgW bit.ly/2F9iLgW] | ||
- | == Результаты == | + | === Результаты === |
{|class="wikitable" | {|class="wikitable" | ||
|- | |- | ||
Строка 33: | Строка 33: | ||
|} | |} | ||
- | == Задача 1 == | + | === Задача 1 === |
Предложить метод, аналогичный методы главных компонент для выборки с признаками, измеренными разнородных шкалах: номинальными, ординальными, линейными, с возможными пропусками. Звездочка: оценить максимальное число пропусков, допустимое для восстановления выборки с заданной точностью. Пример: [http://jmlda.org/papers/doc/2015/no11/Bakhteev2015MissingValues.pdf Бахтеев О.И. Восстановление пропущенных значений в разнородных шкалах с большим числом пропусков // Машинное обучение и анализ данных. 2015. T. 1, №11. C. 1484 - 1499.] | Предложить метод, аналогичный методы главных компонент для выборки с признаками, измеренными разнородных шкалах: номинальными, ординальными, линейными, с возможными пропусками. Звездочка: оценить максимальное число пропусков, допустимое для восстановления выборки с заданной точностью. Пример: [http://jmlda.org/papers/doc/2015/no11/Bakhteev2015MissingValues.pdf Бахтеев О.И. Восстановление пропущенных значений в разнородных шкалах с большим числом пропусков // Машинное обучение и анализ данных. 2015. T. 1, №11. C. 1484 - 1499.] | ||
+ | |||
+ | |||
+ | ==Выбор моделей в задачах регрессии и классификации== |
Версия 12:26, 26 февраля 2018
Постановка задач в машинном обучении, практические занятия
Курс посвящен технике изложения основной идеи исследования. Обсуждаются постановки задач выбора моделей и способы построения функции ошибки. Обсуждение ведется в формате лекций и эссе. Эссе — это изложение идеи постановки и решения задачи. Изложение должно быть достаточно полным (идея восстанавливается однозначно), но кратким (полстраницы) и ясным. Задача ставится формально, желательно использование языка теории множеств, алгебры, матстатистики. Желательно ставить задачу в формате argmin. Пишется в свободной форме, с учетом нашего стиля выполнения научных работ: терминологическая точность и единство обозначений приветствуются[1]. Желательно приводить решение задачи в краткой форме. В начале занятия из написанных эссе выбираются эссе для доклада и обсуждения. Продолжительность доклада 3 минуты. Оценка выставляется за устный доклад: A или Z баллов.
Эссе хранятся в личной папке Group374/Surname2017Essays/. В папке этого примера есть шаблон эссе. Ссылка на эссе делается по шаблону
[http://svn.code.sf.net/p/mlalgorithms/code/Group374/Surname2017Essays/Surname2017Essay1.pdf?format=raw 1]
Важно: в этом году можно делать эссе на слайдах с целью укорочения текста.
- Короткая ссылка на страницу bit.ly/2F9iLgW
Результаты
Автор | Ссылки на эссе | Доклад | |
---|---|---|---|
Федоряка Дмитрий (пример) | 1 , | 1A,2A,3Z,4A,5A,6A,T7,T8 | 10 |
Задача 1
Предложить метод, аналогичный методы главных компонент для выборки с признаками, измеренными разнородных шкалах: номинальными, ординальными, линейными, с возможными пропусками. Звездочка: оценить максимальное число пропусков, допустимое для восстановления выборки с заданной точностью. Пример: Бахтеев О.И. Восстановление пропущенных значений в разнородных шкалах с большим числом пропусков // Машинное обучение и анализ данных. 2015. T. 1, №11. C. 1484 - 1499.