Участник:LyubovLeonteva

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Отчет о научно-исследовательской работе)
(Отчет о научно-исследовательской работе)
Строка 49: Строка 49:
'''Грант'''
'''Грант'''
«Выбор признаков в авторегрессионных задачах прогнозирования», ПГАС
«Выбор признаков в авторегрессионных задачах прогнозирования», ПГАС
 +
<big>'''Осень 2012, 9-й семестр'''</big>
<big>'''Осень 2012, 9-й семестр'''</big>

Версия 11:48, 26 декабря 2012

МФТИ, ФУПМ

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

liubov.sanduleanu@gmail.com

Отчет о научно-исследовательской работе

Весна 2011, 6-й семестр


Многомерная гусеница, выбор длины и числа компонент

В работе описывается метод гусеницы (SSA) и его применение для прогнозирования временных рядов. Алгоритм основан на выделении из изучаемого временного ряда некоторого набора его главных компонент и последующего построения прогноза по выбранному набору. Исследуется зависимость точности прогноза от выбора длины гусеницы и числа ее компонент. В вычислительном эксперименте приводятся результаты работы алгоритма на периодических рядах с разным рисунком внутри периода, на рядах с нарушением периодичности, а так же на реальных рядах почасовой температуры в Москве.

Публикация

Л.Н.Леонтьева Многомерная гусеница, выбор длины и числа компонент // Машинное обучение и анализ данных. — 2011. — № 1. — С. 2-10. — ISSN 2223-3792 (опубликовано).


Осень 2011, 7-й семестр


Выбор признаков в авторегрессионных задачах прогнозирования Исследуется проблема выбора модели оптимальной сложноcти при авторегрессионном прогнозировании. Задача состоит в отыскании наименне обусловленного набора признаков, доставляющего при этом заданное значение функции ошибки. Для выбора этого набора используется модифицированный алгоритм последовательного добавления и удаления признаков. В работе предложен метод поиска оптимальной модели прогнозирования временных рядов. В вычислительном эксперименте приведено сравнение прогнозов рядов почасовых цен на электроэнергию.

Публикации

Л.Н.Леонтьева Выбор моделей прогнозирования цен на электроэнергии // Машинное обучение и анализ данных. — 2011. — № 2. — С. 129-139. — ISSN 2223-3792(опубликовано).

Л.Н.Сандуляну, В.В.Стрижов Выбор признаков в авторегрессионных задачах прогнозирования// Информационные технологии. — 2012. — № 6. — ISSN 1684-6400(принято в печать).


Весна 2012, 8-й семестр


Последовательный выбор признаков при восстановлении регрессии

Исследуется проблема оптимальной сложности модели в связи с ее точностью и устойчивостью. Задача состоит в нахождении наиболее информативного набора признаков в условиях их высокой мультиколлинеарности. Для выбора оптимальной модели используется модифицированный алгоритм шаговой регрессии, являющийся одним из алгоритмов добавления и удаления признаков. Для описания работы пошагового алгоритма предложена модель $n$-мерного куба. Проанализированы величины матожидания и дисперсии функции ошибки.

Публикация

Л.Н.Леонтьева Последовательный выбор признаков при восстановлении регрессии // Машинное обучение и анализ данных. — 2012. — № 3. — С. 63-74. — ISSN 2223-3792(опубликовано).

Грант «Выбор признаков в авторегрессионных задачах прогнозирования», ПГАС


Осень 2012, 9-й семестр


Вероятностная модель одноклассовой классификации

Решается задача одноклассовой классификации электронных писем на предмет наличия в них спама. В работе вводится квазивероятностная модель для классической эмпирической постановки задачи одноклассовой классификации и производится сведение классического подхода к новой модели. Построенные методы классификации проверяются вычислительными экспериментами на модельных и реальных данных.

Публикация

М.О.Бурмистров, Л.Н.Сандуляну Вероятностная модель одноклассовой классификации // Машинное обучение и анализ данных. — 2012. — № 4. — С. . — ISSN 2223-3792(опубликовано).

Личные инструменты