Участник:Neychev

Материал из MachineLearning.

Перейти к: навигация, поиск

МФТИ, ФУПМ

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

neychev@phystech.edu

Отчет о научно-исследовательской работе

Весна 2015, 6-й семестр

Выбор оптимального набора признаков из мультикоррелирующего множества в задаче прогнозирования

В данной статье рассматривается проблема прогнозирования временных рядов. Для получения устойчивого прогноза предлагается рассматривать входные временные ряды как матрицу объект-признак и использовать отбор признаков. В условиях мультиколлинеарности признаков необходим критерий для ее обнаружения. Для этого предлагается применить подход, основанный на методе Белсли. Исключение коррелирующих признаков при отборе позволяет сократить размерность задачи и получить устойчивые оценки параметров модели. Для отбора в работе предлагается метод добавления и удаления признаков. В качестве практической проверки данного метода в ходе вычислительного эксперимента решается задача прогнозирования почасовых значений цен на электроэнергию. Эксперименты были проведены на реальных данных о ценах на электроэнергию в Германии.

Публикация

Нейчев Р.Г., Катруца А.М., Стрижов В.В. Выбор оптимального набора признаков из мультикоррелирующего множества в задаче прогнозирования // Заводская лаборатория. — 2015. — ISSN 1028-6861(отправлена в печать).


Осень 2015, 7-й семестр

Выбор оптимального набора признаков из мультикоррелирующего множества в задаче прогнозирования

Решается задача построения качественной модели представления данных. Каждому объекту сопостоляется его признаковое описание высокой размерности. Необходимо понизить размерность признакового пространства, потеряв при этом наименьшее количество полезной информации. Предполагается, что существуют зависимости между признаками, описывающими объекты. Задача осложняется тем, что эти зависимости могут быть существенно нелинейными. Также информация может быть зашумлена. Для решения поставленной задачи предлагается использовать нелинейное обобщение метода главных компонент, а также, в дальнейшем, провести анализ многоиндексной ковариационной матрицы признаков. Одним из вариантов нелинейного обобщения МГК является использование автоэнкодеров, совершающих нелинейные преобразования над признаками. Предполагается что результаты данной работы смогут быть использованы для построения устойчивых моделей данных и, конкретно, в прогнозировании временных рядов. Программная часть работы реализована на языке MATLAB. В качестве тестовых данных использовались биологические данные, представляющие собой описание молекул различными химическими дескрипторами. Также предполагается использование данного проекта для работы с временными рядами.

Технический отчет

Нейчев Р.Г.http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group274/Neychev2015ConvolutionalNN, Технический отчет //Сервер вычислительных экспериментов mvr.jmlda.org (дата обращения: 29.12.2015)

Доклад на научной конференции

Победитель конкурса научных работ молодых ученых на 58-й научной конференции МФТИ с международным участием. 23-28 ноября 2015г. Доклад "Отбор признаков в условиях мультиколлинеарности в задаче прогнозирования"

Feature generation for multiscale time series forecasting multimodels

TODO - Дописать!

Личные инструменты