Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 774, осень 2012
Материал из MachineLearning.
(Новая: {{Main|Прикладной регрессионный анализ (курс лекций, B.В. Стрижов)}} __NOTOC__ {{tip|Not ready yet; mind the gap.}} Основная за...) |
(→Задачи) |
||
(46 промежуточных версий не показаны.) | |||
Строка 2: | Строка 2: | ||
__NOTOC__ | __NOTOC__ | ||
- | + | '''Основная задача''' этой работы — предложить алгоритм выбора моделей, исследовать и проиллюстрировать его свойства, проанализировать его преимущества недостатки и особенности в сравнении с известными алгоритмами машинного обучения. | |
+ | Практика состоит из задачи, разбитой на три подзадачи-эссе с отчетом и включает постановку задачи, описание алгоритма и вычислительный эксперимент-иллюстрацию. | ||
+ | Перед выполнением заданий рекомендуются прочитать статью [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)|«Численные методы обучения по прецедентам»]], а также все, что там по ссылкам, включая статью [[Автоматизация и стандартизация научных исследований (практика, В.В. Стрижов)|«Автоматизация научных исследований»]]. | ||
- | + | '''Результат практики:''' научная статья по выбранной теме, поданная для публикации | |
- | + | * в [[JMLDA]] или | |
- | + | * в английский журнал из списка Web Of Knowledge. | |
- | Идея практики: проект (вычислительный эксперимент) | + | '''Идея практики:''' любой проект (вычислительный эксперимент) может быть разбит на части, каждая из которых занимает ровно один день и может быть сделана при этом от начала и до конца. |
- | + | ||
- | + | ||
- | + | ||
== Задачи == | == Задачи == | ||
Строка 21: | Строка 20: | ||
! Ссылка SF | ! Ссылка SF | ||
! Дата доклада | ! Дата доклада | ||
- | ! | + | ! Доклад |
|- | |- | ||
- | | | + | | Оценка параметров совместных распределений и использование копул при построении интегральных индикаторов |
- | | | + | | Кузнецов |
- | | | + | | Ивкин |
- | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/ | + | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Kuznetsov2012Copula Kuznetsov2012Copula] |
- | | | + | | 12.11 +2 |
- | | | + | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Kuznetsov2012Copula/doc/CopulaReview/Kuznetsov2012-presentation.pdf Kuznetsov2012Copula] |
|- | |- | ||
+ | | Кластеризация смесей распределений в задачах тематического моделирования | ||
+ | | Сунгуров | ||
+ | | ? | ||
+ | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Sungurov2012Clustering/ Sungurov2012Clustering] | ||
+ | | 12.11 +2 | ||
+ | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Sungurov2012Clustering/doc/Sungurov2012presentation.pdf Sungurov2012Clustering] | ||
+ | |- | ||
+ | | Совместный выбор объектов и признаков в задачах прогнозирования временных рядов | ||
+ | | Ивкин | ||
+ | | Кузнецов | ||
+ | | [https://svn.code.sf.net/p/mlalgorithms/code/Group774/Ivkin2012JointSelection/ 2012JointSelection] | ||
+ | | 26.11 +2 | ||
+ | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Ivkin2012JointSelection/report/Ivkin2012pres.pdf Ivkin2012Mixtures] | ||
+ | |- | ||
+ | | Оценка максимума правдоподобия модели и его математического ожидания методом сэмплирования | ||
+ | | Джамтырова | ||
+ | | ? | ||
+ | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Dzhamtyrova12Sampling Dzhamtyrova2012Sampling] | ||
+ | | 19.11 +2 | ||
+ | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Dzhamtyrova12Sampling/doc/Dzhamtyrova12presentation.pdf Dzhamtyrova2012Sampling] | ||
+ | |- | ||
+ | | Выбор оптимальных инвариантных преобразований в задачах тематического моделирования | ||
+ | | Кононенко | ||
+ | | Животовский | ||
+ | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Kononenko2012Invariants Kononenko2012Invariants] | ||
+ | | 26.11 +2 | ||
+ | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Kononenko2012Invariants/doc/GP/presentationGP.pdf Kononenko2012GP] | ||
+ | |- | ||
+ | | Порождающий и разделяющий подходы в задачах классификации с малыми выборками | ||
+ | | Животовский | ||
+ | | Кононенко | ||
+ | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Zhivotovskiy2012GenVsDisc 2012GenVsDisc] | ||
+ | | 19.11 +2 | ||
+ | | [https://svn.code.sf.net/p/mlalgorithms/code/Group774/Zhivotovskiy2012GenVsDisc/doc/GenVsDisc.pdf GenVsDisc] | ||
+ | |- | ||
+ | | Факторизация матриц в задачах тематического моделирования | ||
+ | | Глушаченков | ||
+ | | ? | ||
+ | | 2012Covariance | ||
+ | | ? +0 | ||
+ | | | ||
|} | |} | ||
- | |||
- | |||
- | |||
- | + | == Оценки == | |
- | * | + | {| class="wikitable" |
- | * | + | |- |
- | * | + | |5 |
- | + | |10 | |
- | + | |Статья в журнале WebOfScience или ScienceDirect | |
+ | |- | ||
+ | | | ||
+ | |9 | ||
+ | | | ||
+ | |- | ||
+ | | | ||
+ | |8 | ||
+ | | | ||
+ | |- | ||
+ | |4 | ||
+ | |7 | ||
+ | |Статья в журнале из списка ВАК | ||
+ | |- | ||
+ | | | ||
+ | |6 | ||
+ | | | ||
+ | |- | ||
+ | | | ||
+ | |5 | ||
+ | |Статья в локальном журнале | ||
+ | |- | ||
+ | |3 | ||
+ | |4 | ||
+ | | | ||
+ | |- | ||
+ | | | ||
+ | |3 | ||
+ | |Заметка на заданную тему | ||
+ | |- | ||
+ | |} | ||
+ | Дополнительно: | ||
+ | * + 2 балла за доклад | ||
+ | * + 2 балла за экзамен, 84 <tex>\leq</tex> оценка <tex>\leq</tex> 100 | ||
+ | * + 1 балл за экзамен, 74 <tex>\leq</tex> оценка <tex> < </tex> 84 | ||
+ | |||
+ | == Темы для 35-минутных докладов (~20 слайдов) == | ||
+ | # Оценка параметров гетерогенных совместных распределений | ||
+ | # Копулы и их полезные свойства, вероятностные методы построения интегральных индикаторов | ||
+ | # Методы сэмплирования и вычисление интегралов функций распределения | ||
+ | # Методы оценки сложности моделей регрессии и классификации | ||
+ | # Порождающий и разделяющий подходы с примерами применения и вероятностными предположениями, и c методами оценки параметров распределений | ||
+ | # Гауссовские процессы в задачах регрессии и классификации, методы оценки параметров ковариационной функции | ||
+ | # Иерархические модели, оценка из параметров и примеры их использования | ||
+ | # Новинки в машинном обучении: structure learning, deep learning и другие | ||
+ | |||
+ | == Расписание == | ||
+ | |||
+ | {|class="wikitable" | ||
+ | ! Дата | ||
+ | ! | ||
+ | ! Что делаем | ||
+ | ! Результат для обсуждения | ||
+ | ! Код | ||
+ | |- | ||
+ | |Сентябрь | ||
+ | |10 | ||
+ | |Выбрана задача, рецензент | ||
+ | |Запись в ML | ||
+ | | | ||
+ | |- | ||
+ | | | ||
+ | |17 | ||
+ | |Выбрана задача, найдены базовые публикации. | ||
+ | |Аннотация, 600 знаков. | ||
+ | |'''A'''nnotation | ||
+ | |- | ||
+ | | | ||
+ | |24 | ||
+ | |Собрана литература, она в bib; найдены данные. | ||
+ | |Введение, примерно одна страница. | ||
+ | |'''I'''ntroduction | ||
+ | |- | ||
+ | |Октябрь | ||
+ | |8 | ||
+ | |Поставлена задача, собраны все материалы по работе. Найдены публикации. | ||
+ | |Постановка задачи, полстраницы. | ||
+ | |'''P'''roblem | ||
+ | |- | ||
+ | | | ||
+ | |15 | ||
+ | |Поставлен вычислительный эксперимент, получены первые результаты. | ||
+ | |Визуализация данных. | ||
+ | |'''V'''isualizing | ||
+ | |- | ||
+ | | | ||
+ | |22 | ||
+ | |Описание алгоритма. | ||
+ | |Алгоритмическая часть (третий раздел). | ||
+ | |'''D'''ocument | ||
+ | |- | ||
+ | | | ||
+ | |29 | ||
+ | |Теоретическая часть. | ||
+ | |Второй раздел. | ||
+ | |'''T'''heory | ||
+ | |- | ||
+ | |Ноябрь | ||
+ | |5 | ||
+ | |Завершение вычислительного эксперимента. | ||
+ | |Описание эксперимента и анализ ошибок. | ||
+ | |'''C'''omp | ||
+ | |- | ||
+ | | | ||
+ | |12 | ||
+ | |Контрольная точка - показ статьи в целом. | ||
+ | |Статья. | ||
+ | |c'''H'''eck | ||
+ | |- | ||
+ | | | ||
+ | |19 | ||
+ | |Доработка статьи; доклад, первая группа. | ||
+ | |Доклад. | ||
+ | |'''S'''how | ||
+ | |- | ||
+ | | | ||
+ | |26 | ||
+ | |Доклад, вторая группа. | ||
+ | |Подача статьи в журнал. | ||
+ | |'''J'''ournal | ||
+ | |- | ||
+ | |Декабрь | ||
+ | |3 | ||
+ | |Доклад, третья группа. | ||
+ | |Рецензия написана, [r]-рецензенту | ||
+ | |'''R'''eview, [r] | ||
+ | |- | ||
+ | | | ||
+ | |10 | ||
+ | |Последний день для претендентов на оценки 10,9,8. | ||
+ | |Экзамен | ||
+ | |(score) | ||
+ | |- | ||
+ | |} | ||
+ | |||
+ | == Оформление == | ||
+ | * Стилевой файл есть тут[http://mlalgorithms.svn.sourceforge.net/viewvc/mlalgorithms/JMLDA/2012no4/] (только не загружайте его обратно в репозиторий) | ||
+ | * [[JMLDA/Fig|Оформление графиков, JMLDA/Fig]] | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
[[Категория:Учебные курсы]] | [[Категория:Учебные курсы]] |
Текущая версия
Основная задача этой работы — предложить алгоритм выбора моделей, исследовать и проиллюстрировать его свойства, проанализировать его преимущества недостатки и особенности в сравнении с известными алгоритмами машинного обучения.
Практика состоит из задачи, разбитой на три подзадачи-эссе с отчетом и включает постановку задачи, описание алгоритма и вычислительный эксперимент-иллюстрацию.
Перед выполнением заданий рекомендуются прочитать статью «Численные методы обучения по прецедентам», а также все, что там по ссылкам, включая статью «Автоматизация научных исследований».
Результат практики: научная статья по выбранной теме, поданная для публикации
- в JMLDA или
- в английский журнал из списка Web Of Knowledge.
Идея практики: любой проект (вычислительный эксперимент) может быть разбит на части, каждая из которых занимает ровно один день и может быть сделана при этом от начала и до конца.
Задачи
Название задачи | Работу выполняет | Рецензент | Ссылка SF | Дата доклада | Доклад |
---|---|---|---|---|---|
Оценка параметров совместных распределений и использование копул при построении интегральных индикаторов | Кузнецов | Ивкин | Kuznetsov2012Copula | 12.11 +2 | Kuznetsov2012Copula |
Кластеризация смесей распределений в задачах тематического моделирования | Сунгуров | ? | Sungurov2012Clustering | 12.11 +2 | Sungurov2012Clustering |
Совместный выбор объектов и признаков в задачах прогнозирования временных рядов | Ивкин | Кузнецов | 2012JointSelection | 26.11 +2 | Ivkin2012Mixtures |
Оценка максимума правдоподобия модели и его математического ожидания методом сэмплирования | Джамтырова | ? | Dzhamtyrova2012Sampling | 19.11 +2 | Dzhamtyrova2012Sampling |
Выбор оптимальных инвариантных преобразований в задачах тематического моделирования | Кононенко | Животовский | Kononenko2012Invariants | 26.11 +2 | Kononenko2012GP |
Порождающий и разделяющий подходы в задачах классификации с малыми выборками | Животовский | Кононенко | 2012GenVsDisc | 19.11 +2 | GenVsDisc |
Факторизация матриц в задачах тематического моделирования | Глушаченков | ? | 2012Covariance | ? +0 |
Оценки
5 | 10 | Статья в журнале WebOfScience или ScienceDirect |
9 | ||
8 | ||
4 | 7 | Статья в журнале из списка ВАК |
6 | ||
5 | Статья в локальном журнале | |
3 | 4 | |
3 | Заметка на заданную тему |
Дополнительно:
- + 2 балла за доклад
- + 2 балла за экзамен, 84 оценка 100
- + 1 балл за экзамен, 74 оценка 84
Темы для 35-минутных докладов (~20 слайдов)
- Оценка параметров гетерогенных совместных распределений
- Копулы и их полезные свойства, вероятностные методы построения интегральных индикаторов
- Методы сэмплирования и вычисление интегралов функций распределения
- Методы оценки сложности моделей регрессии и классификации
- Порождающий и разделяющий подходы с примерами применения и вероятностными предположениями, и c методами оценки параметров распределений
- Гауссовские процессы в задачах регрессии и классификации, методы оценки параметров ковариационной функции
- Иерархические модели, оценка из параметров и примеры их использования
- Новинки в машинном обучении: structure learning, deep learning и другие
Расписание
Дата | Что делаем | Результат для обсуждения | Код | |
---|---|---|---|---|
Сентябрь | 10 | Выбрана задача, рецензент | Запись в ML | |
17 | Выбрана задача, найдены базовые публикации. | Аннотация, 600 знаков. | Annotation | |
24 | Собрана литература, она в bib; найдены данные. | Введение, примерно одна страница. | Introduction | |
Октябрь | 8 | Поставлена задача, собраны все материалы по работе. Найдены публикации. | Постановка задачи, полстраницы. | Problem |
15 | Поставлен вычислительный эксперимент, получены первые результаты. | Визуализация данных. | Visualizing | |
22 | Описание алгоритма. | Алгоритмическая часть (третий раздел). | Document | |
29 | Теоретическая часть. | Второй раздел. | Theory | |
Ноябрь | 5 | Завершение вычислительного эксперимента. | Описание эксперимента и анализ ошибок. | Comp |
12 | Контрольная точка - показ статьи в целом. | Статья. | cHeck | |
19 | Доработка статьи; доклад, первая группа. | Доклад. | Show | |
26 | Доклад, вторая группа. | Подача статьи в журнал. | Journal | |
Декабрь | 3 | Доклад, третья группа. | Рецензия написана, [r]-рецензенту | Review, [r] |
10 | Последний день для претендентов на оценки 10,9,8. | Экзамен | (score) |
Оформление
- Стилевой файл есть тут[1] (только не загружайте его обратно в репозиторий)
- Оформление графиков, JMLDA/Fig