Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 774, осень 2012

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: {{Main|Прикладной регрессионный анализ (курс лекций, B.В. Стрижов)}} __NOTOC__ {{tip|Not ready yet; mind the gap.}} Основная за...)
(Задачи)
 
(46 промежуточных версий не показаны.)
Строка 2: Строка 2:
__NOTOC__
__NOTOC__
-
{{tip|Not ready yet; mind the gap.}}
+
'''Основная задача''' этой работы — предложить алгоритм выбора моделей, исследовать и проиллюстрировать его свойства, проанализировать его преимущества недостатки и особенности в сравнении с известными алгоритмами машинного обучения.
 +
Практика состоит из задачи, разбитой на три подзадачи-эссе с отчетом и включает постановку задачи, описание алгоритма и вычислительный эксперимент-иллюстрацию.
 +
Перед выполнением заданий рекомендуются прочитать статью [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)|«Численные методы обучения по прецедентам»]], а также все, что там по ссылкам, включая статью [[Автоматизация и стандартизация научных исследований (практика, В.В. Стрижов)|«Автоматизация научных исследований»]].
-
Основная задача этого цикла работ — исследовать и проиллюстрировать недостатки и особенности известных алгоритмов машинного обучения.
+
'''Результат практики:''' научная статья по выбранной теме, поданная для публикации
-
Практика состоит из трех задач-эссе с отчетом, включающим постановку задачи, описание алгоритма и вычислительный эксперимент-иллюстрацию.
+
* в [[JMLDA]] или
-
Перед выполнением заданий рекомендуются прочитать статью [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)|«Численные методы обучения по прецедентам»]], а также все, что там по ссылкам.
+
* в английский журнал из списка Web Of Knowledge.
-
Идея практики: проект (вычислительный эксперимент) должен занимать ровно один день и может быть сделан при этом от начала и до конца.
+
'''Идея практики:''' любой проект (вычислительный эксперимент) может быть разбит на части, каждая из которых занимает ровно один день и может быть сделана при этом от начала и до конца.
-
 
+
-
== TODO ==
+
-
Скорее всего будем писать по-английски.
+
== Задачи ==
== Задачи ==
Строка 21: Строка 20:
! Ссылка SF
! Ссылка SF
! Дата доклада
! Дата доклада
-
! Комментарии
+
! Доклад
|-
|-
-
| [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Шаблон отчета о вычислительном эксперименте|Шаблон отчета о вычислительном эксперименте]]
+
| Оценка параметров совместных распределений и использование копул при построении интегральных индикаторов
-
| Welcome!
+
| Кузнецов
-
| Welcome!
+
| Ивкин
-
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Surname2011Title Surname2011Title]
+
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Kuznetsov2012Copula Kuznetsov2012Copula]
-
| 21.09 - обсуждаем расписание докладов
+
| 12.11 +2
-
|
+
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Kuznetsov2012Copula/doc/CopulaReview/Kuznetsov2012-presentation.pdf Kuznetsov2012Copula]
|-
|-
 +
| Кластеризация смесей распределений в задачах тематического моделирования
 +
| Сунгуров
 +
| ?
 +
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Sungurov2012Clustering/ Sungurov2012Clustering]
 +
| 12.11 +2
 +
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Sungurov2012Clustering/doc/Sungurov2012presentation.pdf Sungurov2012Clustering]
 +
|-
 +
| Совместный выбор объектов и признаков в задачах прогнозирования временных рядов
 +
| Ивкин
 +
| Кузнецов
 +
| [https://svn.code.sf.net/p/mlalgorithms/code/Group774/Ivkin2012JointSelection/ 2012JointSelection]
 +
| 26.11 +2
 +
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Ivkin2012JointSelection/report/Ivkin2012pres.pdf Ivkin2012Mixtures]
 +
|-
 +
| Оценка максимума правдоподобия модели и его математического ожидания методом сэмплирования
 +
| Джамтырова
 +
| ?
 +
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Dzhamtyrova12Sampling Dzhamtyrova2012Sampling]
 +
| 19.11 +2
 +
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Dzhamtyrova12Sampling/doc/Dzhamtyrova12presentation.pdf Dzhamtyrova2012Sampling]
 +
|-
 +
| Выбор оптимальных инвариантных преобразований в задачах тематического моделирования
 +
| Кононенко
 +
| Животовский
 +
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Kononenko2012Invariants Kononenko2012Invariants]
 +
| 26.11 +2
 +
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Kononenko2012Invariants/doc/GP/presentationGP.pdf Kononenko2012GP]
 +
|-
 +
| Порождающий и разделяющий подходы в задачах классификации с малыми выборками
 +
| Животовский
 +
| Кононенко
 +
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Zhivotovskiy2012GenVsDisc 2012GenVsDisc]
 +
| 19.11 +2
 +
| [https://svn.code.sf.net/p/mlalgorithms/code/Group774/Zhivotovskiy2012GenVsDisc/doc/GenVsDisc.pdf GenVsDisc]
 +
|-
 +
| Факторизация матриц в задачах тематического моделирования
 +
| Глушаченков
 +
| ?
 +
| 2012Covariance
 +
| ? +0
 +
|
|}
|}
-
== Оформление ==
 
-
[[Изображение:ModelBreadSw.png|200px|thumb|Функция ошибки]]
 
-
Пример оформления работы -- см. ниже по ссылкам в таблице (первый и четвертый столбцы), там можно взять все заготовки.
 
-
Дополнение по оформлению графиков:
+
== Оценки ==
-
* шрифт должен быть больше,
+
{| class="wikitable"
-
* толщина линий равна двум,
+
|-
-
* заголовки осей с большой буквы,
+
|5
-
* заголовок графика отсутствует (чтобы не дублировать подпись в статье);
+
|10
-
* рекомендуется сразу сохранять EPS и PNG (для TeX и для Wiki).
+
|Статья в журнале WebOfScience или ScienceDirect
 +
|-
 +
|
 +
|9
 +
|
 +
|-
 +
|
 +
|8
 +
|
 +
|-
 +
|4
 +
|7
 +
|Статья в журнале из списка ВАК
 +
|-
 +
|
 +
|6
 +
|
 +
|-
 +
|
 +
|5
 +
|Статья в локальном журнале
 +
|-
 +
|3
 +
|4
 +
|
 +
|-
 +
|
 +
|3
 +
|Заметка на заданную тему
 +
|-
 +
|}
 +
Дополнительно:
 +
* + 2 балла за доклад
 +
* + 2 балла за экзамен, 84 <tex>\leq</tex> оценка <tex>\leq</tex> 100
 +
* + 1 балл за экзамен, 74 <tex>\leq</tex> оценка <tex> < </tex> 84
 +
 
 +
== Темы для 35-минутных докладов (~20 слайдов) ==
 +
# Оценка параметров гетерогенных совместных распределений
 +
# Копулы и их полезные свойства, вероятностные методы построения интегральных индикаторов
 +
# Методы сэмплирования и вычисление интегралов функций распределения
 +
# Методы оценки сложности моделей регрессии и классификации
 +
# Порождающий и разделяющий подходы с примерами применения и вероятностными предположениями, и c методами оценки параметров распределений
 +
# Гауссовские процессы в задачах регрессии и классификации, методы оценки параметров ковариационной функции
 +
# Иерархические модели, оценка из параметров и примеры их использования
 +
# Новинки в машинном обучении: structure learning, deep learning и другие
 +
 
 +
== Расписание ==
 +
 
 +
{|class="wikitable"
 +
! Дата
 +
!
 +
! Что делаем
 +
! Результат для обсуждения
 +
! Код
 +
|-
 +
|Сентябрь
 +
|10
 +
|Выбрана задача, рецензент
 +
|Запись в ML
 +
|
 +
|-
 +
|
 +
|17
 +
|Выбрана задача, найдены базовые публикации.
 +
|Аннотация, 600 знаков.
 +
|'''A'''nnotation
 +
|-
 +
|
 +
|24
 +
|Собрана литература, она в bib; найдены данные.
 +
|Введение, примерно одна страница.
 +
|'''I'''ntroduction
 +
|-
 +
|Октябрь
 +
|8
 +
|Поставлена задача, собраны все материалы по работе. Найдены публикации.
 +
|Постановка задачи, полстраницы.
 +
|'''P'''roblem
 +
|-
 +
|
 +
|15
 +
|Поставлен вычислительный эксперимент, получены первые результаты.
 +
|Визуализация данных.
 +
|'''V'''isualizing
 +
|-
 +
|
 +
|22
 +
|Описание алгоритма.
 +
|Алгоритмическая часть (третий раздел).
 +
|'''D'''ocument
 +
|-
 +
|
 +
|29
 +
|Теоретическая часть.
 +
|Второй раздел.
 +
|'''T'''heory
 +
|-
 +
|Ноябрь
 +
|5
 +
|Завершение вычислительного эксперимента.
 +
|Описание эксперимента и анализ ошибок.
 +
|'''C'''omp
 +
|-
 +
|
 +
|12
 +
|Контрольная точка - показ статьи в целом.
 +
|Статья.
 +
|c'''H'''eck
 +
|-
 +
|
 +
|19
 +
|Доработка статьи; доклад, первая группа.
 +
|Доклад.
 +
|'''S'''how
 +
|-
 +
|
 +
|26
 +
|Доклад, вторая группа.
 +
|Подача статьи в журнал.
 +
|'''J'''ournal
 +
|-
 +
|Декабрь
 +
|3
 +
|Доклад, третья группа.
 +
|Рецензия написана, [r]-рецензенту
 +
|'''R'''eview, [r]
 +
|-
 +
|
 +
|10
 +
|Последний день для претендентов на оценки 10,9,8.
 +
|Экзамен
 +
|(score)
 +
|-
 +
|}
 +
 
 +
== Оформление ==
 +
* Стилевой файл есть тут[http://mlalgorithms.svn.sourceforge.net/viewvc/mlalgorithms/JMLDA/2012no4/] (только не загружайте его обратно в репозиторий)
 +
* [[JMLDA/Fig|Оформление графиков, JMLDA/Fig]]
-
<source lang="matlab">
 
-
h = figure; hold('on');
 
-
plot(xi,y,'r-', 'Linewidth', 2);
 
-
plot(xi,y,'b.', 'MarkerSize', 12);
 
-
axis('tight');
 
-
xlabel('Time, $\xi$', 'FontSize', 24, 'FontName', 'Times', 'Interpreter','latex');
 
-
ylabel('Value, $y$', 'FontSize', 24, 'FontName', 'Times', 'Interpreter','latex');
 
-
set(gca, 'FontSize', 24, 'FontName', 'Times')
 
-
saveas(h,'ModelOne.eps', 'psc2');
 
-
saveas(h,'ModelOne.png', 'png');
 
-
</source>
 
[[Категория:Учебные курсы]]
[[Категория:Учебные курсы]]

Текущая версия


Основная задача этой работы — предложить алгоритм выбора моделей, исследовать и проиллюстрировать его свойства, проанализировать его преимущества недостатки и особенности в сравнении с известными алгоритмами машинного обучения. Практика состоит из задачи, разбитой на три подзадачи-эссе с отчетом и включает постановку задачи, описание алгоритма и вычислительный эксперимент-иллюстрацию. Перед выполнением заданий рекомендуются прочитать статью «Численные методы обучения по прецедентам», а также все, что там по ссылкам, включая статью «Автоматизация научных исследований».

Результат практики: научная статья по выбранной теме, поданная для публикации

  • в JMLDA или
  • в английский журнал из списка Web Of Knowledge.

Идея практики: любой проект (вычислительный эксперимент) может быть разбит на части, каждая из которых занимает ровно один день и может быть сделана при этом от начала и до конца.

Задачи

Название задачи Работу выполняет Рецензент Ссылка SF Дата доклада Доклад
Оценка параметров совместных распределений и использование копул при построении интегральных индикаторов Кузнецов Ивкин Kuznetsov2012Copula 12.11 +2 Kuznetsov2012Copula
Кластеризация смесей распределений в задачах тематического моделирования Сунгуров  ? Sungurov2012Clustering 12.11 +2 Sungurov2012Clustering
Совместный выбор объектов и признаков в задачах прогнозирования временных рядов Ивкин Кузнецов 2012JointSelection 26.11 +2 Ivkin2012Mixtures
Оценка максимума правдоподобия модели и его математического ожидания методом сэмплирования Джамтырова  ? Dzhamtyrova2012Sampling 19.11 +2 Dzhamtyrova2012Sampling
Выбор оптимальных инвариантных преобразований в задачах тематического моделирования Кононенко Животовский Kononenko2012Invariants 26.11 +2 Kononenko2012GP
Порождающий и разделяющий подходы в задачах классификации с малыми выборками Животовский Кононенко 2012GenVsDisc 19.11 +2 GenVsDisc
Факторизация матриц в задачах тематического моделирования Глушаченков  ? 2012Covariance  ? +0

Оценки

5 10 Статья в журнале WebOfScience или ScienceDirect
9
8
4 7 Статья в журнале из списка ВАК
6
5 Статья в локальном журнале
3 4
3 Заметка на заданную тему

Дополнительно:

  • + 2 балла за доклад
  • + 2 балла за экзамен, 84 \leq оценка \leq 100
  • + 1 балл за экзамен, 74 \leq оценка  < 84

Темы для 35-минутных докладов (~20 слайдов)

  1. Оценка параметров гетерогенных совместных распределений
  2. Копулы и их полезные свойства, вероятностные методы построения интегральных индикаторов
  3. Методы сэмплирования и вычисление интегралов функций распределения
  4. Методы оценки сложности моделей регрессии и классификации
  5. Порождающий и разделяющий подходы с примерами применения и вероятностными предположениями, и c методами оценки параметров распределений
  6. Гауссовские процессы в задачах регрессии и классификации, методы оценки параметров ковариационной функции
  7. Иерархические модели, оценка из параметров и примеры их использования
  8. Новинки в машинном обучении: structure learning, deep learning и другие

Расписание

Дата Что делаем Результат для обсуждения Код
Сентябрь 10 Выбрана задача, рецензент Запись в ML
17 Выбрана задача, найдены базовые публикации. Аннотация, 600 знаков. Annotation
24 Собрана литература, она в bib; найдены данные. Введение, примерно одна страница. Introduction
Октябрь 8 Поставлена задача, собраны все материалы по работе. Найдены публикации. Постановка задачи, полстраницы. Problem
15 Поставлен вычислительный эксперимент, получены первые результаты. Визуализация данных. Visualizing
22 Описание алгоритма. Алгоритмическая часть (третий раздел). Document
29 Теоретическая часть. Второй раздел. Theory
Ноябрь 5 Завершение вычислительного эксперимента. Описание эксперимента и анализ ошибок. Comp
12 Контрольная точка - показ статьи в целом. Статья. cHeck
19 Доработка статьи; доклад, первая группа. Доклад. Show
26 Доклад, вторая группа. Подача статьи в журнал. Journal
Декабрь 3 Доклад, третья группа. Рецензия написана, [r]-рецензенту Review, [r]
10 Последний день для претендентов на оценки 10,9,8. Экзамен (score)

Оформление

Личные инструменты