Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 874, весна 2011

Материал из MachineLearning.

(Различия между версиями)

Перейти к: навигация, поиск

Версия 22:20, 2 марта 2011

Основная статья: Численные методы обучения по прецедентам (практика, В.В. Стрижов)

- Перед выполнением заданий рекомендуются к прочтению

Численные методы обучения по прецедентам

Отчет о выполнении исследовательского проекта

Автоматизация и стандартизация научных исследований

Задачи

- - - - - - - - - - - - - - - - - - -

Название задачи -	Работу выполняет -	Работу рецензирует -	Комментарии -
Прогнозирование с использованием теста Гренжера (пример) -	Анастасия Мотренко -	-	-
Выбор функции активации при прогнозировании нейронными сетями (пример) -	Георгий Рудой -	Николай Балдин -	-
Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример) -	Любовь Леонтьева -	Михаил Бурмистров -	-
Прогнозирование функциями дискретного аргумента (пример) -	Егор Будников -	Александр Романенко -	-
Исследование сходимости при прогнозировании нейронными сетями с обратной связью (пример) -	Николай Балдин -	Георгий Рудой -	-
Непараметрическое прогнозирование: выбор ядра из набора, настройка параметров (пример) -	Михаил Кокшаров -	-	-
Экспоненциальное сглаживание и прогноз (пример) -	Бурмистров Михаил -	-	-
Выравнивание временных рядов: прогнозирование с использованием DTW (пример) -	Романенко Александр -	Егор Будников -	-
Многомерная авторегрессия (пример) -	Ямщиков Илья -	-	-
Локальные методы прогнозирования,поиск метрики (пример) -	Евгений Гребенников -	Михаил Кокшаров -	-
Локальные методы прогнозирования,поиск инвариантного преобразования (пример) -	Юлия Хаспулатова -	-	-
Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж) -	Токмакова Александра -	Будников Егор -	-
Многомерная гусеница, выбор временных рядов при прогнозировании(пример) -	Элина Торчинская -	-	-
Прогнозирование и аппроксимация сплайнами -	Мищенко Павел -	-	-
ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)(пример) -	Ганусевич Ирина -	-	-
Прогнозирование и SVN – регрессия(пример) -	Ситник Александр -	-	-

В конце названия слово "(пример)" является ключевым и означает "пример работы алгоритма".

Краткое описание задач

Краткосрочное прогнозирование почасовых цен на электроэнергию (пример)

- Описание задачи.

Задача 2: Экспоненциальное сглаживание и прогноз (пример)

- Прогнозирование методом экспоненциальной регрессии является идейно простым алгоритмом прогнозирования временных рядов. Идея метода основана на учете предшествующих значений ряда с убывающими весами. В своей простейшей реализации алгоритм сильно сглаживает ряд и плохо учитывает тренды, сезонность и резкие изменения в тренде, а также необоснованно заметно реагирует на выбросы в данных. Предполагается изучение и реализация алгоритмов, пытающихся найти оптимальную модель путем минимизации ошибки на известном временном ряду.

Задача 3: Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж) (пример)

- Целью проекта является нахождение закономерности в определённом процессе и сравнение базового алгоритма, проводящего прогнозирование с помощью скользящего среднего, с алгоритмом, учитывающим цикличность задачи. Также необходимо исследовать различные флуктуации входящих параметров и минимизировать при этом отклонения.

- Данный алгоритм можно использовать при прогнозировании цен, объёмов продаж, туристических потоков – любых процессов, подразумевающих наличие временных рядов с периодической составляющей. Алгоритм не предусмотрен для работы в авральных ситуациях, таких как: промо-акции, праздники и т.д. - данные ситуации описываются отдельной задачей. Результатом проекта является оценка эффективности алгоритма, учитывающего цикличность задачи.

Задача 4: Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)

- Требуется исследовать SSA-алгоритм (метод гусеницы) для многомерных временных рядов. Метод заключается в преобразовании ряда с помощью однопараметрической сдвиговой процедуры с последующим исследованием полученной траектории с помощью анализа главных компонент и восстановлением ряда по выбранным главным компонентам. В работе будет исследован вопрос выбора длины гусеницы и числа ее компонент, т.е. то, как определить по полученному разложению на компоненты, какие из них являются неинформативными (шумы). Также метод помогает увидеть и выделить разного рода закономерности в поведении временных рядов.

- Результатом работы является выяснение эффективности работы алгоритма в зависимости от длины и числа компонент гусеницы, а также выяснение возможностей алгоритма и его области применимости.

Задача 7: Локальные методы прогнозирования,поиск метрики (пример)

- Временной ряд делится на отдельные участки, каждому из которых сопоставляется точка в n-мерном пространстве признаков. Локальная модель рассчитывается в три последовательных этапа.

- Первый – находит k-ближайших соседей наблюдаемой точки.

- Второй – строит простую модель, используя только этих k соседей.

- Третий – используя даную модель, по наблюдаемой точке прогнозирует следующую.

- Многие исследователи, используют эвклидову метрику для измерения расстояний между точками.

- Данная работа призвана сравнить точность прогнозирования при использовании различных метрик.

- В частности, требуется исследовать оптимальный набор весов во взвешенной метрике для максимизации точности прогнозирования.

Задача 8: Локальные методы прогнозирования, поиск инвариантного преобразования (пример)

В проекте используются локальные методы прогнозирования

В данной работе подробно исследован следующий метод (обобщение классического

«ближайшего соседа»). - Пусть ) ,..., ( ~ + Пусть имеется временной ряд, и стоит задача требуется продолжить его. Предполагается, что такое продолжение определяется - 1 n f f f = – временной ряд, требуется продолжить его + «предысторией», т.е. в ряде нужно найти часть, которая после - 1 1 t n n n f f f f g + + = . Предполагается, что такое продолжение определяется + некоторого преобразования A «становится похожа» на ту часть, которую мы стремимся прогнозировать. Поиск такого преобразования A и есть цель данного проекта. Для определения степени «похожести» используется метрика B – функция близости двух отрезков - «предысторией» ) ,..., ( 1 n l n f f + - , т.е. в ряде нужно найти часть ) ,..., ( 1 k l k f f + - , которая после + временного ряда (подробнее об этом см.Локальные методы прогнозирования, поиск инвариантного преобразования (пример)). Так мы находим ближайшего соседа к нашей предыстории. В общем случае ищем несколько - некоторого преобразования A «становится похожа» на ) ,..., ( 1 n l n f f + - : + ближайших соседей. Продолжение запишется в виде их линейной комбинации. - a k k l k k l k f f f f A B ~ , 1 1 min ) ) ,..., ( ), ,..., ( ( ® + - + - , + - здесь a~ – параметры преобразования A, B – функция близости двух отрезков + - временного ряда (например, евклидово расстояние между отрезками или взвешенное + - евклидово расстояние, которое «последним» точкам приписывает больший вес). + - Определив k , мы находим ближайшего соседа к нашей предыстории. Искомое + - продолжение запишется в виде ) ,..., ( 1 t k k f f A + + . В общем случае ищем несколько + - ближайших соседей. Продолжение запишется в виде их линейной комбинации + - å å = + + + - r + - r + - r + - t k k r c f f A c r r 1 , ) ,..., ( 1 . +

Задача 9: Выравнивание временных рядов: прогнозирование с использованием DTW (пример)

Задача 12: Исследование сходимости при прогнозировании нейронными сетями с боратной связью (пример)

Цель проекта - иследовать зависимость сходимости прогнозирования от параметров нейронной сети. Понятие обратной связи характерно для динамических систем, в которой выходной сигнал некоторого элемента истемы оказыает влияние на входной сигнал этого элемента. Входной Сигнал $x_{j}(n)$ , внутренний сигнал $x_{j}^{'}(n)$ и выходной сигнал $y_{j}(n)$ связаны соотношениями: $y_{k}(n) = A[x_{j}^{'}(n)]$ ; $x_{j}^{'}(n) = x_{j}(n) + B[y_{j}(n)]$

Задача 13: Многомерная гусеница, выбор временных рядов при прогнозировании(пример)

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%A7%D0%B8%D1%81%D0%BB%D0%B5%D0%BD%D0%BD%D1%8B%D0%B5_%D0%BC%D0%B5%D1%82%D0%BE%D0%B4%D1%8B_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D1%8F_%D0%BF%D0%BE_%D0%BF%D1%80%D0%B5%D1%86%D0%B5%D0%B4%D0%B5%D0%BD%D1%82%D0%B0%D0%BC_%28%D0%BF%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D0%BA%D0%B0%2C_%D0%92.%D0%92._%D0%A1%D1%82%D1%80%D0%B8%D0%B6%D0%BE%D0%B2%29/%D0%93%D1%80%D1%83%D0%BF%D0%BF%D0%B0_874%2C_%D0%B2%D0%B5%D1%81%D0%BD%D0%B0_2011»