Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 974, весна 2012
Материал из MachineLearning.
(→Список задач) |
м (→Список задач) |
||
(95 промежуточных версий не показаны.) | |||
Строка 12: | Строка 12: | ||
! Комментарии | ! Комментарии | ||
|- | |- | ||
- | | | + | |CMARS: аппроксимация сплайнами |
- | | | + | |Влада Целых |
- | | Татьяна Шпакова | + | |Татьяна Шпакова |
- | | | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Celyh2012CMARS/ Celyh2012CMARS] |
- | | | + | |[.]сaipvdstrj(10) |
|- | |- | ||
- | | | + | |Алгоритмические основы построения банковских скоринговых карт |
- | | | + | |Александр Адуенко |
- | | | + | |Алина Иванова |
- | | | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Aduenko2012economics/ Aduenko2012economics] |
- | | | + | |[.]сaipvdstrj(10) |
|- | |- | ||
- | | | + | |Использование метода главных компонент при построении интегральных индикаторов |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
|Мария Медведникова | |Мария Медведникова | ||
|Светлана Цыганова | |Светлана Цыганова | ||
- | | | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Medvednikova2012PCA/ Medvednikova2012PCA] |
- | | | + | |[r]сaipvdstrj(10) |
|- | |- | ||
- | | | + | |Многоуровневая классификация при обнаружении движения цен |
- | | | + | |Арсентий Кузьмин |
- | | | + | |Анна Варфоломеева |
- | | | + | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Kuzmin2012TimeRows/ Kuzmin2012TimeRows] |
- | | | + | |[r]сaipvdstjr(10) |
|- | |- | ||
- | | | + | |Локальные методы прогнозирования с выбором инвариантного преобразования |
- | | | + | |Светлана Цыганова |
- | | | + | |Мария Медведникова |
- | | | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Tsyganova2012LocalForecast/ Tsyganova2012 LocalForecast] |
- | | | + | |[r]сaipvdstjr(10) |
|- | |- | ||
- | | | + | |Прогноз квазипериодических многомерных временных рядов непараметрическими методами (пример) |
- | | | + | |Егор Клочков |
- | | | + | |Александр Шульга |
- | | | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Klochkov2012Goods4Cast Klochkov2012Goods4Cast] |
- | | | + | |[r]сaipvdstj.(10) |
|- | |- | ||
- | | | + | |Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии (пример) |
|Степан Лобастов | |Степан Лобастов | ||
- | | | + | |Егор Клочков |
- | | | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Lobastov2012FOSelection/ Lobastov2012FOSelection] |
- | | | + | |[r]сaipvdstrj(10) |
|- | |- | ||
- | | | + | |Локальные методы прогнозирования с выбором метрики |
- | + | |Анна Варфоломеева | |
- | + | ||
- | + | ||
- | + | ||
- | | | + | |
- | + | ||
|Арсентий Кузьмин | |Арсентий Кузьмин | ||
- | | | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Varfolomeeva2012LocForecastMetrics/ Varfolomeeva2012 LocForecastMetrics] |
- | | | + | |[r]сaipvdstjr(10) |
- | + | ||
|- | |- | ||
- | | | + | |Полиномы Чебышева и прогнозирование временных рядов |
- | | | + | |Валерия Бочкарева |
- | | | + | |Степан Лобастов |
- | | | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Bochkareva2012TimeSeriesPrediction Bochkareva2012TimeSeriesPrediction] |
- | | | + | |[.]сaipvdst-r(9) |
|- | |- | ||
+ | |Кластеризация и составление словаря аминокислотных последовательностей | ||
+ | |Татьяна Шпакова | ||
+ | |Влада Целых | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Shpakova2012Clustering/ Shpakova2012Clustering] | ||
+ | |[.]сaipvdst..(9) | ||
+ | |- | ||
+ | |Векторная авторегрессия и управление макроэкономическими показателями | ||
+ | |Александр Шульга | ||
| | | | ||
- | | | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Shulga2012VAR Shulga2012VAR] |
- | | | + | |[.]сaipvds...(9) |
- | + | ||
- | + | ||
|- | |- | ||
+ | |Аппроксимация эмпирических функций распределения | ||
+ | |Алина Иванова | ||
+ | |Александр Адуенко | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Ivanova2012ApproximateFunc/ Ivanova2012 ApproximateFunc] | ||
+ | |[r]сaipvd....(9) | ||
+ | |- | ||
+ | <!-- | ||
+ | |[[Oblivious Decision Trees (пример) ]] | ||
+ | |Кирилл Татунов | ||
| | | | ||
- | | | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Tatunov2012ObliviousDecisionTrees Tatunov2012ObliviousDecisionTrees] |
- | + | |с. | |
- | + | ||
- | |с | + | |
|- | |- | ||
+ | --> | ||
|} | |} | ||
Строка 99: | Строка 101: | ||
! Что делаем | ! Что делаем | ||
! Результат для обсуждения | ! Результат для обсуждения | ||
+ | ! '''c'''ode | ||
|- | |- | ||
| Февраль | | Февраль | ||
Строка 104: | Строка 107: | ||
| Выбрана задача, найдены базовые публикации. | | Выбрана задача, найдены базовые публикации. | ||
| Аннотация, 600 знаков. | | Аннотация, 600 знаков. | ||
+ | | '''a'''nnotation | ||
|- | |- | ||
| Март | | Март | ||
- | | | + | | 14 |
| Собрана литература, она в bib; найдены данные. | | Собрана литература, она в bib; найдены данные. | ||
| Введение, примерно одна страница. | | Введение, примерно одна страница. | ||
+ | | '''i'''troduction | ||
|- | |- | ||
| | | | ||
- | | | + | | 21 |
| Поставлена задача, собраны материалы по работе. Найдены публикации. | | Поставлена задача, собраны материалы по работе. Найдены публикации. | ||
| Постановка задачи, полстраницы. | | Постановка задачи, полстраницы. | ||
+ | | '''p'''roblem | ||
|- | |- | ||
| | | | ||
- | | | + | | 28 |
| Поставлен вычислительный эксперимент, получены первые результаты. | | Поставлен вычислительный эксперимент, получены первые результаты. | ||
| Визуализация данных. | | Визуализация данных. | ||
+ | | '''v'''isualizing | ||
|- | |- | ||
- | | | + | | Апрель |
- | | | + | | 4 |
| Описание алгоритма, часть 1. | | Описание алгоритма, часть 1. | ||
| Теоретическая часть. | | Теоретическая часть. | ||
+ | | '''d'''ocument | ||
|- | |- | ||
- | | | + | | |
- | | | + | | 11 |
| Описание алгоритма, часть 2. | | Описание алгоритма, часть 2. | ||
| Теоретическая часть завершена. | | Теоретическая часть завершена. | ||
+ | | d | ||
|- | |- | ||
| | | | ||
- | | | + | | 18 |
| Завершение вычислительного эксперимента. | | Завершение вычислительного эксперимента. | ||
| Контрольная точка - показ статьи в целом. | | Контрольная точка - показ статьи в целом. | ||
+ | | '''s'''how | ||
|- | |- | ||
| | | | ||
- | | | + | | 25 |
- | | Доработка статьи. | + | | Доработка статьи; доклад, первая группа. |
- | | Доклад | + | | Доклад. |
+ | | '''t'''alk | ||
|- | |- | ||
| | | | ||
- | | 25 | + | | 25 |
- | + | ||
| Доклад, вторая группа. | | Доклад, вторая группа. | ||
+ | | Подача статьи в журнал. | ||
+ | | '''j'''ournal | ||
|- | |- | ||
+ | | Май | ||
+ | | 3 | ||
+ | | Доклад, третья группа. | ||
+ | | Рецензия написана, [r]-рецензенту | ||
+ | | '''r'''eview, [r] | ||
+ | |- | ||
+ | | | ||
+ | | 10 | ||
+ | | '''Последний день для претендентов на оценки 10,9.''' | ||
+ | | Зачет | ||
+ | | '''('''score''')''' | ||
+ | |- | ||
|} | |} | ||
== Аннотации == | == Аннотации == | ||
- | === | + | === Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии === |
- | + | Логистическая регрессия – это статистическая модель, которая применяется для предсказания вероятности возникновения некоторого события по значениям множества признаков. Она находит применение, например, в медицине [http://math.tntech.edu/machida/MSD/lecture7.pdf] и кредитном скроллинге. В реальных условиях число признаков обычно велико, и важнейшей задачей является выбор только существенных признаков , а также поиск объектов, которые по тем или иным причинам являются атипичными. | |
- | + | Ключевые слова: logit model, feature selection, boosting. | |
- | + | ||
- | + | ===Использование метода главных компонент при построении интегральных индикаторов=== | |
+ | В данной работе рассматривается использование метода главных компонент при построении интегральных индикаторов. Полученные результаты сравниваются с результатами, даваемыми методом расслоения Парето. Строится интегральный индикатор для российских вузов. Для этого используются биографии 30 богатейших бизнесменов России по версии журнала "Forbes" за 2011 год. | ||
- | + | ''Ключевые слова'': интегральный индикатор, экспертные оценки, веса параметров, метод главных компонент, метод расслоения Парето. | |
- | + | ||
- | + | ||
- | + | ===Аппроксимация эмпирических функций распределения=== | |
- | + | Работа посвящена методам аппроксимации функций для эффективного вычисления интегралов. В практических задачах обычно имеются данные в определенных точках времени или пространства. При построении предположений об остальных точках возникает необходимость аппроксимации функции распределения исследуемой величины, а также оценка соответствующей ошибки. Для ее расчета есть возможность использовать методы разной точности. | |
- | + | ||
+ | Ключевые слова: метод Монте-Карло, вычисление функцй распределения, эмпирические функции распределения. | ||
+ | |||
+ | ===Методы локального прогнозирования с выбором преобразования=== | ||
+ | Задачи прогнозирования временных рядов имеют множество приложений в различных областях, таких как экономика, физика, медицина. Их решением является прогноз на недалекое будущее по уже известным значениям прогнозируемого ряда в предыдущие моменты времени. В работе будет построен алгоритм локального прогнозирования с учетом преобразований, позволяющий без участия человека выявить визуально похожие участки временного ряда. | ||
+ | |||
+ | Ключевые слова: локальное прогнозирование, преобразование | ||
== Черновой список задач == | == Черновой список задач == | ||
- | # | + | # Кластеризация и составление словаря аминокислотных последовательностей |
- | # | + | # Oblivious decision trees: алгоритм Яндекс для системы Полигон |
- | # | + | # Сравнительный анализ регрессионных остатков в SVN-регрессии |
- | # | + | # Алгоритмы нахождения гауссовских смесей |
- | # | + | # Прогноз квазипериодических многомерных временных рядов непараметрическими методами |
- | + | # Многоуровневая классификация при обнаружении движения цен | |
- | # | + | # CMARS: аппроксимация сплайнами |
- | + | # Полиномы Чебышева и метод прогонки при прогнозировании временных рядов | |
- | # | + | # Сравнение методов ARMA и FLS при ретроспективном прогнозировании |
- | # | + | # Локальные методы прогнозирования с выбором метрики |
- | # | + | # Локальные методы прогнозирования с выбором инвариантного преобразования |
- | # | + | # Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии |
- | # | + | # Векторная авторегрессия и управление макроэкономическими показателями |
- | # | + | # Построение рейтинга российских вузов по открытым данным об успешности карьеры их выпускников |
- | # | + | |
- | # | + | |
- | == | + | == Ещё задачи == |
- | # | + | # Анализ текста методами структурного обучения |
- | # | + | # Аппроксимация эмпирических функций распределения |
- | # | + | # Алгоритмические основы построения банковских скоринговых карт |
+ | # Сингулярное разложение и поисковая машина | ||
+ | # Сравнение алгоритмов многокритериальной оптимизации | ||
# Уточнение экспертных оценок на данных в ранговых шкалах (интервальные, конусы, веса экспертов, копулы) | # Уточнение экспертных оценок на данных в ранговых шкалах (интервальные, конусы, веса экспертов, копулы) | ||
# Уточнение экспертных оценок при анализе работы механизма устойчивого развития энергетики | # Уточнение экспертных оценок при анализе работы механизма устойчивого развития энергетики | ||
+ | # Визуализация пространства параметров регрессионных моделей | ||
+ | # Восстановление регрессии методом главных компонент | ||
+ | # Оценка гиперпараметров путем сэмплирования | ||
+ | # Прореживание существенно нелинейных моделей с помощью гиперпараметров | ||
+ | # Фактор Оккама для параметрических моделей с известной областью определения параметров | ||
+ | # Создание алгоритмов последовательной модификации моделей | ||
+ | # Порождение и выбор моделей классификации | ||
+ | |||
+ | == И еще задачи == | ||
+ | * Функция расстояния между формулами и поиск. | ||
+ | * Поиск объектов (техническая работа). | ||
+ | |||
+ | == + == | ||
+ | * Авторегрессия | ||
+ | * Векторная авторегрессия | ||
+ | * Экспоненциальное сглаживание | ||
+ | * Локальные методы, поиск метрики | ||
+ | * Локальные методы с инвариантами, метрика фиксирована | ||
+ | * ARIMA | ||
+ | * Многомерная гусеница, выбор длины гусеницы | ||
+ | * Многомерная гусеница, выбор рядов | ||
+ | * Прогнозирование с использованием DTW | ||
+ | * Скользящее среднее, выбор ядер | ||
+ | * Скользящее среднее с забыванием истории | ||
+ | * Скользящее среднее временных рядов с периодической составляющей | ||
+ | * Прогнозирование нейронными сетями | ||
+ | * Анализ качества прогноза | ||
+ | * Метаописание временных рядов | ||
+ | * Логическое прогнозирование | ||
+ | * SVN – регрессия | ||
+ | * Дискретное прогнозирование, музыка. | ||
== Составить == | == Составить == | ||
* Список типичных типографических ошибок | * Список типичных типографических ошибок | ||
* Список ошибок BibTeX | * Список ошибок BibTeX |
Текущая версия
Список задач
Название задачи | Автор | Рецензент | Ссылка на работу | Комментарии |
---|---|---|---|---|
CMARS: аппроксимация сплайнами | Влада Целых | Татьяна Шпакова | Celyh2012CMARS | [.]сaipvdstrj(10) |
Алгоритмические основы построения банковских скоринговых карт | Александр Адуенко | Алина Иванова | Aduenko2012economics | [.]сaipvdstrj(10) |
Использование метода главных компонент при построении интегральных индикаторов | Мария Медведникова | Светлана Цыганова | Medvednikova2012PCA | [r]сaipvdstrj(10) |
Многоуровневая классификация при обнаружении движения цен | Арсентий Кузьмин | Анна Варфоломеева | Kuzmin2012TimeRows | [r]сaipvdstjr(10) |
Локальные методы прогнозирования с выбором инвариантного преобразования | Светлана Цыганова | Мария Медведникова | Tsyganova2012 LocalForecast | [r]сaipvdstjr(10) |
Прогноз квазипериодических многомерных временных рядов непараметрическими методами (пример) | Егор Клочков | Александр Шульга | Klochkov2012Goods4Cast | [r]сaipvdstj.(10) |
Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии (пример) | Степан Лобастов | Егор Клочков | Lobastov2012FOSelection | [r]сaipvdstrj(10) |
Локальные методы прогнозирования с выбором метрики | Анна Варфоломеева | Арсентий Кузьмин | Varfolomeeva2012 LocForecastMetrics | [r]сaipvdstjr(10) |
Полиномы Чебышева и прогнозирование временных рядов | Валерия Бочкарева | Степан Лобастов | Bochkareva2012TimeSeriesPrediction | [.]сaipvdst-r(9) |
Кластеризация и составление словаря аминокислотных последовательностей | Татьяна Шпакова | Влада Целых | Shpakova2012Clustering | [.]сaipvdst..(9) |
Векторная авторегрессия и управление макроэкономическими показателями | Александр Шульга | Shulga2012VAR | [.]сaipvds...(9) | |
Аппроксимация эмпирических функций распределения | Алина Иванова | Александр Адуенко | Ivanova2012 ApproximateFunc | [r]сaipvd....(9) |
Общий план работ
Дата | Что делаем | Результат для обсуждения | code | |
---|---|---|---|---|
Февраль | 29 | Выбрана задача, найдены базовые публикации. | Аннотация, 600 знаков. | annotation |
Март | 14 | Собрана литература, она в bib; найдены данные. | Введение, примерно одна страница. | itroduction |
21 | Поставлена задача, собраны материалы по работе. Найдены публикации. | Постановка задачи, полстраницы. | problem | |
28 | Поставлен вычислительный эксперимент, получены первые результаты. | Визуализация данных. | visualizing | |
Апрель | 4 | Описание алгоритма, часть 1. | Теоретическая часть. | document |
11 | Описание алгоритма, часть 2. | Теоретическая часть завершена. | d | |
18 | Завершение вычислительного эксперимента. | Контрольная точка - показ статьи в целом. | show | |
25 | Доработка статьи; доклад, первая группа. | Доклад. | talk | |
25 | Доклад, вторая группа. | Подача статьи в журнал. | journal | |
Май | 3 | Доклад, третья группа. | Рецензия написана, [r]-рецензенту | review, [r] |
10 | Последний день для претендентов на оценки 10,9. | Зачет | (score) |
Аннотации
Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии
Логистическая регрессия – это статистическая модель, которая применяется для предсказания вероятности возникновения некоторого события по значениям множества признаков. Она находит применение, например, в медицине [1] и кредитном скроллинге. В реальных условиях число признаков обычно велико, и важнейшей задачей является выбор только существенных признаков , а также поиск объектов, которые по тем или иным причинам являются атипичными.
Ключевые слова: logit model, feature selection, boosting.
Использование метода главных компонент при построении интегральных индикаторов
В данной работе рассматривается использование метода главных компонент при построении интегральных индикаторов. Полученные результаты сравниваются с результатами, даваемыми методом расслоения Парето. Строится интегральный индикатор для российских вузов. Для этого используются биографии 30 богатейших бизнесменов России по версии журнала "Forbes" за 2011 год.
Ключевые слова: интегральный индикатор, экспертные оценки, веса параметров, метод главных компонент, метод расслоения Парето.
Аппроксимация эмпирических функций распределения
Работа посвящена методам аппроксимации функций для эффективного вычисления интегралов. В практических задачах обычно имеются данные в определенных точках времени или пространства. При построении предположений об остальных точках возникает необходимость аппроксимации функции распределения исследуемой величины, а также оценка соответствующей ошибки. Для ее расчета есть возможность использовать методы разной точности.
Ключевые слова: метод Монте-Карло, вычисление функцй распределения, эмпирические функции распределения.
Методы локального прогнозирования с выбором преобразования
Задачи прогнозирования временных рядов имеют множество приложений в различных областях, таких как экономика, физика, медицина. Их решением является прогноз на недалекое будущее по уже известным значениям прогнозируемого ряда в предыдущие моменты времени. В работе будет построен алгоритм локального прогнозирования с учетом преобразований, позволяющий без участия человека выявить визуально похожие участки временного ряда.
Ключевые слова: локальное прогнозирование, преобразование
Черновой список задач
- Кластеризация и составление словаря аминокислотных последовательностей
- Oblivious decision trees: алгоритм Яндекс для системы Полигон
- Сравнительный анализ регрессионных остатков в SVN-регрессии
- Алгоритмы нахождения гауссовских смесей
- Прогноз квазипериодических многомерных временных рядов непараметрическими методами
- Многоуровневая классификация при обнаружении движения цен
- CMARS: аппроксимация сплайнами
- Полиномы Чебышева и метод прогонки при прогнозировании временных рядов
- Сравнение методов ARMA и FLS при ретроспективном прогнозировании
- Локальные методы прогнозирования с выбором метрики
- Локальные методы прогнозирования с выбором инвариантного преобразования
- Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии
- Векторная авторегрессия и управление макроэкономическими показателями
- Построение рейтинга российских вузов по открытым данным об успешности карьеры их выпускников
Ещё задачи
- Анализ текста методами структурного обучения
- Аппроксимация эмпирических функций распределения
- Алгоритмические основы построения банковских скоринговых карт
- Сингулярное разложение и поисковая машина
- Сравнение алгоритмов многокритериальной оптимизации
- Уточнение экспертных оценок на данных в ранговых шкалах (интервальные, конусы, веса экспертов, копулы)
- Уточнение экспертных оценок при анализе работы механизма устойчивого развития энергетики
- Визуализация пространства параметров регрессионных моделей
- Восстановление регрессии методом главных компонент
- Оценка гиперпараметров путем сэмплирования
- Прореживание существенно нелинейных моделей с помощью гиперпараметров
- Фактор Оккама для параметрических моделей с известной областью определения параметров
- Создание алгоритмов последовательной модификации моделей
- Порождение и выбор моделей классификации
И еще задачи
- Функция расстояния между формулами и поиск.
- Поиск объектов (техническая работа).
+
- Авторегрессия
- Векторная авторегрессия
- Экспоненциальное сглаживание
- Локальные методы, поиск метрики
- Локальные методы с инвариантами, метрика фиксирована
- ARIMA
- Многомерная гусеница, выбор длины гусеницы
- Многомерная гусеница, выбор рядов
- Прогнозирование с использованием DTW
- Скользящее среднее, выбор ядер
- Скользящее среднее с забыванием истории
- Скользящее среднее временных рядов с периодической составляющей
- Прогнозирование нейронными сетями
- Анализ качества прогноза
- Метаописание временных рядов
- Логическое прогнозирование
- SVN – регрессия
- Дискретное прогнозирование, музыка.
Составить
- Список типичных типографических ошибок
- Список ошибок BibTeX