Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 974, весна 2012
Материал из MachineLearning.
(→Черновик, 3-й курс) |
м (→Список задач) |
||
(130 промежуточных версий не показаны.) | |||
Строка 3: | Строка 3: | ||
- | == | + | == Список задач == |
- | + | {|class="wikitable" | |
- | + | |- | |
- | + | ! Название задачи | |
- | + | ! Автор | |
- | + | ! Рецензент | |
- | + | ! Ссылка на работу | |
- | + | ! Комментарии | |
- | + | |- | |
- | + | |CMARS: аппроксимация сплайнами | |
- | + | |Влада Целых | |
- | + | |Татьяна Шпакова | |
- | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Celyh2012CMARS/ Celyh2012CMARS] | |
- | + | |[.]сaipvdstrj(10) | |
+ | |- | ||
+ | |Алгоритмические основы построения банковских скоринговых карт | ||
+ | |Александр Адуенко | ||
+ | |Алина Иванова | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Aduenko2012economics/ Aduenko2012economics] | ||
+ | |[.]сaipvdstrj(10) | ||
+ | |- | ||
+ | |Использование метода главных компонент при построении интегральных индикаторов | ||
+ | |Мария Медведникова | ||
+ | |Светлана Цыганова | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Medvednikova2012PCA/ Medvednikova2012PCA] | ||
+ | |[r]сaipvdstrj(10) | ||
+ | |- | ||
+ | |Многоуровневая классификация при обнаружении движения цен | ||
+ | |Арсентий Кузьмин | ||
+ | |Анна Варфоломеева | ||
+ | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Kuzmin2012TimeRows/ Kuzmin2012TimeRows] | ||
+ | |[r]сaipvdstjr(10) | ||
+ | |- | ||
+ | |Локальные методы прогнозирования с выбором инвариантного преобразования | ||
+ | |Светлана Цыганова | ||
+ | |Мария Медведникова | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Tsyganova2012LocalForecast/ Tsyganova2012 LocalForecast] | ||
+ | |[r]сaipvdstjr(10) | ||
+ | |- | ||
+ | |Прогноз квазипериодических многомерных временных рядов непараметрическими методами (пример) | ||
+ | |Егор Клочков | ||
+ | |Александр Шульга | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Klochkov2012Goods4Cast Klochkov2012Goods4Cast] | ||
+ | |[r]сaipvdstj.(10) | ||
+ | |- | ||
+ | |Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии (пример) | ||
+ | |Степан Лобастов | ||
+ | |Егор Клочков | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Lobastov2012FOSelection/ Lobastov2012FOSelection] | ||
+ | |[r]сaipvdstrj(10) | ||
+ | |- | ||
+ | |Локальные методы прогнозирования с выбором метрики | ||
+ | |Анна Варфоломеева | ||
+ | |Арсентий Кузьмин | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Varfolomeeva2012LocForecastMetrics/ Varfolomeeva2012 LocForecastMetrics] | ||
+ | |[r]сaipvdstjr(10) | ||
+ | |- | ||
+ | |Полиномы Чебышева и прогнозирование временных рядов | ||
+ | |Валерия Бочкарева | ||
+ | |Степан Лобастов | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Bochkareva2012TimeSeriesPrediction Bochkareva2012TimeSeriesPrediction] | ||
+ | |[.]сaipvdst-r(9) | ||
+ | |- | ||
+ | |Кластеризация и составление словаря аминокислотных последовательностей | ||
+ | |Татьяна Шпакова | ||
+ | |Влада Целых | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Shpakova2012Clustering/ Shpakova2012Clustering] | ||
+ | |[.]сaipvdst..(9) | ||
+ | |- | ||
+ | |Векторная авторегрессия и управление макроэкономическими показателями | ||
+ | |Александр Шульга | ||
+ | | | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Shulga2012VAR Shulga2012VAR] | ||
+ | |[.]сaipvds...(9) | ||
+ | |- | ||
+ | |Аппроксимация эмпирических функций распределения | ||
+ | |Алина Иванова | ||
+ | |Александр Адуенко | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Ivanova2012ApproximateFunc/ Ivanova2012 ApproximateFunc] | ||
+ | |[r]сaipvd....(9) | ||
+ | |- | ||
+ | <!-- | ||
+ | |[[Oblivious Decision Trees (пример) ]] | ||
+ | |Кирилл Татунов | ||
+ | | | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Tatunov2012ObliviousDecisionTrees Tatunov2012ObliviousDecisionTrees] | ||
+ | |с. | ||
+ | |- | ||
+ | --> | ||
+ | |} | ||
+ | == Общий план работ == | ||
- | = | + | {|class="wikitable" |
- | + | ! Дата | |
- | + | ! | |
- | + | ! Что делаем | |
- | + | ! Результат для обсуждения | |
+ | ! '''c'''ode | ||
+ | |- | ||
+ | | Февраль | ||
+ | | 29 | ||
+ | | Выбрана задача, найдены базовые публикации. | ||
+ | | Аннотация, 600 знаков. | ||
+ | | '''a'''nnotation | ||
+ | |- | ||
+ | | Март | ||
+ | | 14 | ||
+ | | Собрана литература, она в bib; найдены данные. | ||
+ | | Введение, примерно одна страница. | ||
+ | | '''i'''troduction | ||
+ | |- | ||
+ | | | ||
+ | | 21 | ||
+ | | Поставлена задача, собраны материалы по работе. Найдены публикации. | ||
+ | | Постановка задачи, полстраницы. | ||
+ | | '''p'''roblem | ||
+ | |- | ||
+ | | | ||
+ | | 28 | ||
+ | | Поставлен вычислительный эксперимент, получены первые результаты. | ||
+ | | Визуализация данных. | ||
+ | | '''v'''isualizing | ||
+ | |- | ||
+ | | Апрель | ||
+ | | 4 | ||
+ | | Описание алгоритма, часть 1. | ||
+ | | Теоретическая часть. | ||
+ | | '''d'''ocument | ||
+ | |- | ||
+ | | | ||
+ | | 11 | ||
+ | | Описание алгоритма, часть 2. | ||
+ | | Теоретическая часть завершена. | ||
+ | | d | ||
+ | |- | ||
+ | | | ||
+ | | 18 | ||
+ | | Завершение вычислительного эксперимента. | ||
+ | | Контрольная точка - показ статьи в целом. | ||
+ | | '''s'''how | ||
+ | |- | ||
+ | | | ||
+ | | 25 | ||
+ | | Доработка статьи; доклад, первая группа. | ||
+ | | Доклад. | ||
+ | | '''t'''alk | ||
+ | |- | ||
+ | | | ||
+ | | 25 | ||
+ | | Доклад, вторая группа. | ||
+ | | Подача статьи в журнал. | ||
+ | | '''j'''ournal | ||
+ | |- | ||
+ | | Май | ||
+ | | 3 | ||
+ | | Доклад, третья группа. | ||
+ | | Рецензия написана, [r]-рецензенту | ||
+ | | '''r'''eview, [r] | ||
+ | |- | ||
+ | | | ||
+ | | 10 | ||
+ | | '''Последний день для претендентов на оценки 10,9.''' | ||
+ | | Зачет | ||
+ | | '''('''score''')''' | ||
+ | |- | ||
+ | |} | ||
- | == | + | == Аннотации == |
+ | === Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии === | ||
+ | Логистическая регрессия – это статистическая модель, которая применяется для предсказания вероятности возникновения некоторого события по значениям множества признаков. Она находит применение, например, в медицине [http://math.tntech.edu/machida/MSD/lecture7.pdf] и кредитном скроллинге. В реальных условиях число признаков обычно велико, и важнейшей задачей является выбор только существенных признаков , а также поиск объектов, которые по тем или иным причинам являются атипичными. | ||
+ | |||
+ | Ключевые слова: logit model, feature selection, boosting. | ||
+ | |||
+ | ===Использование метода главных компонент при построении интегральных индикаторов=== | ||
+ | В данной работе рассматривается использование метода главных компонент при построении интегральных индикаторов. Полученные результаты сравниваются с результатами, даваемыми методом расслоения Парето. Строится интегральный индикатор для российских вузов. Для этого используются биографии 30 богатейших бизнесменов России по версии журнала "Forbes" за 2011 год. | ||
+ | |||
+ | ''Ключевые слова'': интегральный индикатор, экспертные оценки, веса параметров, метод главных компонент, метод расслоения Парето. | ||
+ | |||
+ | ===Аппроксимация эмпирических функций распределения=== | ||
+ | Работа посвящена методам аппроксимации функций для эффективного вычисления интегралов. В практических задачах обычно имеются данные в определенных точках времени или пространства. При построении предположений об остальных точках возникает необходимость аппроксимации функции распределения исследуемой величины, а также оценка соответствующей ошибки. Для ее расчета есть возможность использовать методы разной точности. | ||
+ | |||
+ | Ключевые слова: метод Монте-Карло, вычисление функцй распределения, эмпирические функции распределения. | ||
+ | |||
+ | ===Методы локального прогнозирования с выбором преобразования=== | ||
+ | Задачи прогнозирования временных рядов имеют множество приложений в различных областях, таких как экономика, физика, медицина. Их решением является прогноз на недалекое будущее по уже известным значениям прогнозируемого ряда в предыдущие моменты времени. В работе будет построен алгоритм локального прогнозирования с учетом преобразований, позволяющий без участия человека выявить визуально похожие участки временного ряда. | ||
+ | |||
+ | Ключевые слова: локальное прогнозирование, преобразование | ||
+ | |||
+ | == Черновой список задач == | ||
+ | # Кластеризация и составление словаря аминокислотных последовательностей | ||
+ | # Oblivious decision trees: алгоритм Яндекс для системы Полигон | ||
+ | # Сравнительный анализ регрессионных остатков в SVN-регрессии | ||
+ | # Алгоритмы нахождения гауссовских смесей | ||
+ | # Прогноз квазипериодических многомерных временных рядов непараметрическими методами | ||
+ | # Многоуровневая классификация при обнаружении движения цен | ||
+ | # CMARS: аппроксимация сплайнами | ||
+ | # Полиномы Чебышева и метод прогонки при прогнозировании временных рядов | ||
+ | # Сравнение методов ARMA и FLS при ретроспективном прогнозировании | ||
+ | # Локальные методы прогнозирования с выбором метрики | ||
+ | # Локальные методы прогнозирования с выбором инвариантного преобразования | ||
+ | # Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии | ||
+ | # Векторная авторегрессия и управление макроэкономическими показателями | ||
+ | # Построение рейтинга российских вузов по открытым данным об успешности карьеры их выпускников | ||
+ | |||
+ | == Ещё задачи == | ||
+ | # Анализ текста методами структурного обучения | ||
+ | # Аппроксимация эмпирических функций распределения | ||
+ | # Алгоритмические основы построения банковских скоринговых карт | ||
+ | # Сингулярное разложение и поисковая машина | ||
+ | # Сравнение алгоритмов многокритериальной оптимизации | ||
+ | # Уточнение экспертных оценок на данных в ранговых шкалах (интервальные, конусы, веса экспертов, копулы) | ||
+ | # Уточнение экспертных оценок при анализе работы механизма устойчивого развития энергетики | ||
+ | # Визуализация пространства параметров регрессионных моделей | ||
+ | # Восстановление регрессии методом главных компонент | ||
+ | # Оценка гиперпараметров путем сэмплирования | ||
+ | # Прореживание существенно нелинейных моделей с помощью гиперпараметров | ||
+ | # Фактор Оккама для параметрических моделей с известной областью определения параметров | ||
+ | # Создание алгоритмов последовательной модификации моделей | ||
+ | # Порождение и выбор моделей классификации | ||
+ | |||
+ | == И еще задачи == | ||
+ | * Функция расстояния между формулами и поиск. | ||
+ | * Поиск объектов (техническая работа). | ||
+ | |||
+ | == + == | ||
+ | * Авторегрессия | ||
+ | * Векторная авторегрессия | ||
+ | * Экспоненциальное сглаживание | ||
+ | * Локальные методы, поиск метрики | ||
+ | * Локальные методы с инвариантами, метрика фиксирована | ||
+ | * ARIMA | ||
+ | * Многомерная гусеница, выбор длины гусеницы | ||
+ | * Многомерная гусеница, выбор рядов | ||
+ | * Прогнозирование с использованием DTW | ||
+ | * Скользящее среднее, выбор ядер | ||
+ | * Скользящее среднее с забыванием истории | ||
+ | * Скользящее среднее временных рядов с периодической составляющей | ||
+ | * Прогнозирование нейронными сетями | ||
+ | * Анализ качества прогноза | ||
+ | * Метаописание временных рядов | ||
+ | * Логическое прогнозирование | ||
+ | * SVN – регрессия | ||
+ | * Дискретное прогнозирование, музыка. | ||
+ | |||
+ | == Составить == | ||
* Список типичных типографических ошибок | * Список типичных типографических ошибок | ||
* Список ошибок BibTeX | * Список ошибок BibTeX |
Текущая версия
Список задач
Название задачи | Автор | Рецензент | Ссылка на работу | Комментарии |
---|---|---|---|---|
CMARS: аппроксимация сплайнами | Влада Целых | Татьяна Шпакова | Celyh2012CMARS | [.]сaipvdstrj(10) |
Алгоритмические основы построения банковских скоринговых карт | Александр Адуенко | Алина Иванова | Aduenko2012economics | [.]сaipvdstrj(10) |
Использование метода главных компонент при построении интегральных индикаторов | Мария Медведникова | Светлана Цыганова | Medvednikova2012PCA | [r]сaipvdstrj(10) |
Многоуровневая классификация при обнаружении движения цен | Арсентий Кузьмин | Анна Варфоломеева | Kuzmin2012TimeRows | [r]сaipvdstjr(10) |
Локальные методы прогнозирования с выбором инвариантного преобразования | Светлана Цыганова | Мария Медведникова | Tsyganova2012 LocalForecast | [r]сaipvdstjr(10) |
Прогноз квазипериодических многомерных временных рядов непараметрическими методами (пример) | Егор Клочков | Александр Шульга | Klochkov2012Goods4Cast | [r]сaipvdstj.(10) |
Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии (пример) | Степан Лобастов | Егор Клочков | Lobastov2012FOSelection | [r]сaipvdstrj(10) |
Локальные методы прогнозирования с выбором метрики | Анна Варфоломеева | Арсентий Кузьмин | Varfolomeeva2012 LocForecastMetrics | [r]сaipvdstjr(10) |
Полиномы Чебышева и прогнозирование временных рядов | Валерия Бочкарева | Степан Лобастов | Bochkareva2012TimeSeriesPrediction | [.]сaipvdst-r(9) |
Кластеризация и составление словаря аминокислотных последовательностей | Татьяна Шпакова | Влада Целых | Shpakova2012Clustering | [.]сaipvdst..(9) |
Векторная авторегрессия и управление макроэкономическими показателями | Александр Шульга | Shulga2012VAR | [.]сaipvds...(9) | |
Аппроксимация эмпирических функций распределения | Алина Иванова | Александр Адуенко | Ivanova2012 ApproximateFunc | [r]сaipvd....(9) |
Общий план работ
Дата | Что делаем | Результат для обсуждения | code | |
---|---|---|---|---|
Февраль | 29 | Выбрана задача, найдены базовые публикации. | Аннотация, 600 знаков. | annotation |
Март | 14 | Собрана литература, она в bib; найдены данные. | Введение, примерно одна страница. | itroduction |
21 | Поставлена задача, собраны материалы по работе. Найдены публикации. | Постановка задачи, полстраницы. | problem | |
28 | Поставлен вычислительный эксперимент, получены первые результаты. | Визуализация данных. | visualizing | |
Апрель | 4 | Описание алгоритма, часть 1. | Теоретическая часть. | document |
11 | Описание алгоритма, часть 2. | Теоретическая часть завершена. | d | |
18 | Завершение вычислительного эксперимента. | Контрольная точка - показ статьи в целом. | show | |
25 | Доработка статьи; доклад, первая группа. | Доклад. | talk | |
25 | Доклад, вторая группа. | Подача статьи в журнал. | journal | |
Май | 3 | Доклад, третья группа. | Рецензия написана, [r]-рецензенту | review, [r] |
10 | Последний день для претендентов на оценки 10,9. | Зачет | (score) |
Аннотации
Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии
Логистическая регрессия – это статистическая модель, которая применяется для предсказания вероятности возникновения некоторого события по значениям множества признаков. Она находит применение, например, в медицине [1] и кредитном скроллинге. В реальных условиях число признаков обычно велико, и важнейшей задачей является выбор только существенных признаков , а также поиск объектов, которые по тем или иным причинам являются атипичными.
Ключевые слова: logit model, feature selection, boosting.
Использование метода главных компонент при построении интегральных индикаторов
В данной работе рассматривается использование метода главных компонент при построении интегральных индикаторов. Полученные результаты сравниваются с результатами, даваемыми методом расслоения Парето. Строится интегральный индикатор для российских вузов. Для этого используются биографии 30 богатейших бизнесменов России по версии журнала "Forbes" за 2011 год.
Ключевые слова: интегральный индикатор, экспертные оценки, веса параметров, метод главных компонент, метод расслоения Парето.
Аппроксимация эмпирических функций распределения
Работа посвящена методам аппроксимации функций для эффективного вычисления интегралов. В практических задачах обычно имеются данные в определенных точках времени или пространства. При построении предположений об остальных точках возникает необходимость аппроксимации функции распределения исследуемой величины, а также оценка соответствующей ошибки. Для ее расчета есть возможность использовать методы разной точности.
Ключевые слова: метод Монте-Карло, вычисление функцй распределения, эмпирические функции распределения.
Методы локального прогнозирования с выбором преобразования
Задачи прогнозирования временных рядов имеют множество приложений в различных областях, таких как экономика, физика, медицина. Их решением является прогноз на недалекое будущее по уже известным значениям прогнозируемого ряда в предыдущие моменты времени. В работе будет построен алгоритм локального прогнозирования с учетом преобразований, позволяющий без участия человека выявить визуально похожие участки временного ряда.
Ключевые слова: локальное прогнозирование, преобразование
Черновой список задач
- Кластеризация и составление словаря аминокислотных последовательностей
- Oblivious decision trees: алгоритм Яндекс для системы Полигон
- Сравнительный анализ регрессионных остатков в SVN-регрессии
- Алгоритмы нахождения гауссовских смесей
- Прогноз квазипериодических многомерных временных рядов непараметрическими методами
- Многоуровневая классификация при обнаружении движения цен
- CMARS: аппроксимация сплайнами
- Полиномы Чебышева и метод прогонки при прогнозировании временных рядов
- Сравнение методов ARMA и FLS при ретроспективном прогнозировании
- Локальные методы прогнозирования с выбором метрики
- Локальные методы прогнозирования с выбором инвариантного преобразования
- Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии
- Векторная авторегрессия и управление макроэкономическими показателями
- Построение рейтинга российских вузов по открытым данным об успешности карьеры их выпускников
Ещё задачи
- Анализ текста методами структурного обучения
- Аппроксимация эмпирических функций распределения
- Алгоритмические основы построения банковских скоринговых карт
- Сингулярное разложение и поисковая машина
- Сравнение алгоритмов многокритериальной оптимизации
- Уточнение экспертных оценок на данных в ранговых шкалах (интервальные, конусы, веса экспертов, копулы)
- Уточнение экспертных оценок при анализе работы механизма устойчивого развития энергетики
- Визуализация пространства параметров регрессионных моделей
- Восстановление регрессии методом главных компонент
- Оценка гиперпараметров путем сэмплирования
- Прореживание существенно нелинейных моделей с помощью гиперпараметров
- Фактор Оккама для параметрических моделей с известной областью определения параметров
- Создание алгоритмов последовательной модификации моделей
- Порождение и выбор моделей классификации
И еще задачи
- Функция расстояния между формулами и поиск.
- Поиск объектов (техническая работа).
+
- Авторегрессия
- Векторная авторегрессия
- Экспоненциальное сглаживание
- Локальные методы, поиск метрики
- Локальные методы с инвариантами, метрика фиксирована
- ARIMA
- Многомерная гусеница, выбор длины гусеницы
- Многомерная гусеница, выбор рядов
- Прогнозирование с использованием DTW
- Скользящее среднее, выбор ядер
- Скользящее среднее с забыванием истории
- Скользящее среднее временных рядов с периодической составляющей
- Прогнозирование нейронными сетями
- Анализ качества прогноза
- Метаописание временных рядов
- Логическое прогнозирование
- SVN – регрессия
- Дискретное прогнозирование, музыка.
Составить
- Список типичных типографических ошибок
- Список ошибок BibTeX