Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 874, весна 2011

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 1: Строка 1:
-
{{Main|Численные методы обучения по прецедентам (практика, В.В. Стрижов)}}
 
-
__NOTOC__
 
-
 
-
Перед выполнением заданий рекомендуются к прочтению
 
-
* [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)|Численные методы обучения по прецедентам]]
 
-
* [[Отчет о выполнении исследовательского проекта (практика, В.В. Стрижов)|Отчет о выполнении исследовательского проекта]]
 
-
* [[Автоматизация и стандартизация научных исследований (практика, В.В. Стрижов)|Автоматизация и стандартизация научных исследований]]
 
-
 
-
== Задачи ==
 
-
{| class="wikitable"
 
-
|-
 
-
! Название задачи
 
-
! Работу выполняет
 
-
! Работу рецензирует
 
-
! Комментарии
 
-
|-
 
-
| [[Прогнозирование с использованием теста Гренжера (пример)]]
 
-
| Анастасия Мотренко
 
-
|
 
-
|
 
-
|-
 
-
| [[Выбор функции активации при прогнозировании нейронными сетями (пример)]]
 
-
| Георгий Рудой
 
-
| Николай Балдин
 
-
|
 
-
|-
 
-
| [[Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)]]
 
-
| Любовь Леонтьева
 
-
| Михаил Бурмистров
 
-
|
 
-
|-
 
-
| [[Прогнозирование функциями дискретного аргумента (пример)]]
 
-
| Егор Будников
 
-
| Александр Романенко
 
-
|
 
-
|-
 
-
| [[Исследование сходимости при прогнозировании нейронными сетями с обратной связью (пример)]]
 
-
| Николай Балдин
 
-
| Георгий Рудой
 
-
|
 
-
|-
 
-
| [[Непараметрическое прогнозирование: выбор ядра из набора, настройка параметров (пример)]]
 
-
| Михаил Кокшаров
 
-
|
 
-
|
 
-
|-
 
-
|[[Экспоненциальное сглаживание и прогноз (пример)]]
 
-
|Бурмистров Михаил
 
-
|
 
-
|
 
-
|-
 
-
|[[Выравнивание временных рядов: прогнозирование с использованием DTW (пример)]]
 
-
|Романенко Александр
 
-
|Егор Будников
 
-
|
 
-
|-
 
-
|[[Многомерная авторегрессия (пример)]]
 
-
|Ямщиков Илья
 
-
|
 
-
|
 
-
|-
 
-
|[[Локальные методы прогнозирования,поиск метрики (пример)]]
 
-
|Евгений Гребенников
 
-
|Михаил Кокшаров
 
-
|
 
-
|-
 
-
|[[Локальные методы прогнозирования,поиск инвариантного преобразования (пример)]]
 
-
|Юлия Хаспулатова
 
-
|
 
-
|
 
-
|-
 
-
|[[Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж)]]
 
-
|Токмакова Александра
 
-
|Будников Егор
 
-
|
 
-
|-
 
-
|[[Многомерная гусеница, выбор временных рядов при прогнозировании(пример)]]
 
-
|Элина Торчинская
 
-
|
 
-
|
 
-
|-
 
-
|[[Прогнозирование и аппроксимация сплайнами]]
 
-
|Мищенко Павел
 
-
|
 
-
|
 
-
|-
 
-
|[[ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)(пример)]]
 
-
|Ганусевич Ирина
 
-
|
 
-
|
 
-
|-
 
-
|[[Прогнозирование и SVN – регрессия(пример)]]
 
-
|Ситник Александр
 
-
|
 
-
|
 
-
|-
 
-
|}
 
-
 
-
{{tip|В конце названия слово "(пример)" является ключевым и означает "пример работы алгоритма".}}
 
-
 
-
 
-
==Краткое описание задач==
 
-
=== [[Краткосрочное прогнозирование почасовых цен на электроэнергию (пример)]] ===
 
-
Описание задачи.
 
-
 
-
=== Задача 2: [[Экспоненциальное сглаживание и прогноз (пример)]] ===
 
-
Прогнозирование методом экспоненциальной регрессии является идейно простым алгоритмом прогнозирования временных рядов. Идея метода основана на учете предшествующих значений ряда с убывающими весами. В своей простейшей реализации алгоритм сильно сглаживает ряд и плохо учитывает тренды, сезонность и резкие изменения в тренде, а также необоснованно заметно реагирует на выбросы в данных. Предполагается изучение и реализация алгоритмов, пытающихся найти оптимальную модель путем минимизации ошибки на известном временном ряду.
 
-
 
-
=== Задача 3: [[Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж) (пример)]] ===
 
-
 
-
Целью проекта является нахождение закономерности в определённом процессе и сравнение базового алгоритма, проводящего прогнозирование с помощью скользящего среднего, с алгоритмом, учитывающим цикличность задачи. Также необходимо исследовать различные флуктуации входящих параметров и минимизировать при этом отклонения.
 
-
 
-
Данный алгоритм можно использовать при прогнозировании цен, объёмов продаж, туристических потоков – любых процессов, подразумевающих наличие временных рядов с периодической составляющей. Алгоритм не предусмотрен для работы в авральных ситуациях, таких как: промо-акции, праздники и т.д. - данные ситуации описываются отдельной задачей. Результатом проекта является оценка эффективности алгоритма, учитывающего цикличность задачи.
 
-
 
-
===Задача 4: [[Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)]]===
 
-
 
-
Требуется исследовать SSA-алгоритм (метод гусеницы) для многомерных временных рядов. Метод заключается в преобразовании ряда с помощью однопараметрической сдвиговой процедуры с последующим исследованием полученной траектории с помощью анализа главных компонент и восстановлением ряда по выбранным главным компонентам. В работе будет исследован вопрос выбора длины гусеницы и числа ее компонент, т.е. то, как определить по полученному разложению на компоненты, какие из них являются неинформативными (шумы). Также метод помогает увидеть и выделить разного рода закономерности в поведении временных рядов.
 
-
 
-
Результатом работы является выяснение эффективности работы алгоритма в зависимости от длины и числа компонент гусеницы, а также выяснение возможностей алгоритма и его области применимости.
 
-
 
-
===Задача 7: [[Локальные методы прогнозирования,поиск метрики (пример)]]===
 
-
Временной ряд делится на отдельные участки, каждому из которых сопоставляется точка в n-мерном пространстве признаков. Локальная модель рассчитывается в три последовательных этапа.
 
-
Первый – находит k-ближайших соседей наблюдаемой точки.
 
-
Второй – строит простую модель, используя только этих k соседей.
 
-
Третий – используя даную модель, по наблюдаемой точке прогнозирует следующую.
 
-
Многие исследователи, используют эвклидову метрику для измерения расстояний между точками.
 
-
Данная работа призвана сравнить точность прогнозирования при использовании различных метрик.
 
-
В частности, требуется исследовать оптимальный набор весов во взвешенной метрике для максимизации точности прогнозирования.
 
===Задача 8: [[Локальные методы прогнозирования, поиск инвариантного преобразования (пример)]]===
===Задача 8: [[Локальные методы прогнозирования, поиск инвариантного преобразования (пример)]]===
Строка 135: Строка 7:
В данной работе подробно исследован следующий метод (обобщение классического
В данной работе подробно исследован следующий метод (обобщение классического
«ближайшего соседа»).
«ближайшего соседа»).
-
Пусть ) ,..., ( ~
+
Пусть имеется временной ряд, и стоит задача требуется продолжить его. Предполагается, что такое продолжение определяется
-
1 n f f f = – временной ряд, требуется продолжить его
+
«предысторией», т.е. в ряде нужно найти часть, которая после
-
1 1 t n n n f f f f g + + = . Предполагается, что такое продолжение определяется
+
некоторого преобразования A «становится похожа» на ту часть, которую мы стремимся прогнозировать. Поиск такого преобразования A и есть цель данного проекта. Для определения степени «похожести» используется метрика B – функция близости двух отрезков
-
«предысторией» ) ,..., ( 1 n l n f f + - , т.е. в ряде нужно найти часть ) ,..., ( 1 k l k f f + - , которая после
+
временного ряда (подробнее об этом см.[[Локальные методы прогнозирования, поиск инвариантного преобразования (пример)]]). Так мы находим ближайшего соседа к нашей предыстории. В общем случае ищем несколько
-
некоторого преобразования A «становится похожа» на ) ,..., ( 1 n l n f f + - :
+
ближайших соседей. Продолжение запишется в виде их линейной комбинации.
-
a k k l k k l k f f f f A B ~ , 1 1 min ) ) ,..., ( ), ,..., ( ( ® + - + - ,
+
-
здесь a~ – параметры преобразования A, B – функция близости двух отрезков
+
-
временного ряда (например, евклидово расстояние между отрезками или взвешенное
+
-
евклидово расстояние, которое «последним» точкам приписывает больший вес).
+
-
Определив k , мы находим ближайшего соседа к нашей предыстории. Искомое
+
-
продолжение запишется в виде ) ,..., ( 1 t k k f f A + + . В общем случае ищем несколько
+
-
ближайших соседей. Продолжение запишется в виде их линейной комбинации
+
-
å å = + +
+
-
r
+
-
r
+
-
r
+
-
t k k r c f f A c r r 1 , ) ,..., ( 1 .
+
=== Задача 9: [[Выравнивание временных рядов: прогнозирование с использованием DTW (пример)]] ===
=== Задача 9: [[Выравнивание временных рядов: прогнозирование с использованием DTW (пример)]] ===

Версия 22:13, 2 марта 2011

Содержание

Задача 8: Локальные методы прогнозирования, поиск инвариантного преобразования (пример)

В проекте используются локальные методы прогнозирования временных рядов. Эти методы отказываются от нахождения представления временного ряда в классе заданных функций от времени. Вместо этого прогноз осуществляется на основе данных о каком-то участке временного ряда (используется локальная В данной работе подробно исследован следующий метод (обобщение классического «ближайшего соседа»).

Пусть имеется временной ряд, и стоит задача требуется продолжить его. Предполагается, что такое продолжение определяется

«предысторией», т.е. в ряде нужно найти часть, которая после некоторого преобразования A «становится похожа» на ту часть, которую мы стремимся прогнозировать. Поиск такого преобразования A и есть цель данного проекта. Для определения степени «похожести» используется метрика B – функция близости двух отрезков временного ряда (подробнее об этом см.Локальные методы прогнозирования, поиск инвариантного преобразования (пример)). Так мы находим ближайшего соседа к нашей предыстории. В общем случае ищем несколько ближайших соседей. Продолжение запишется в виде их линейной комбинации.

Задача 9: Выравнивание временных рядов: прогнозирование с использованием DTW (пример)

Временным рядом называется последовательность упорядоченных по времени значений некоторой вещественной переменной $\mathbf{x}=\{x_{t}\}_{t=1}^T\in\mathbb{R}^T$. Задача, сопутствующая появлению временных рядов, - сравнение одной последовательности данных с другой. Сравнение последовательностей существенно упрощается после деформации временного ряда вдоль одной из осей и его выравнивания. Dynamic time warping (DTW) представляет собой технику эффективного выравнивая временных рядов. Методы DTW используются при распознавании речи, при анализе информации в робототехнике, в промышленности, в медицине и других сферах.

Цель работы - привести пример выравнивания, ввести функционал сравнения двух временных рядов, обладающий естественными свойствами коммутативности, рефлексивности и транзитивностина. Функционал должен принимать на вход два временных ряда, а на выходе давать число, характеризующее степень их "похожести".

Задача 10: Выбор функции активации при прогнозировании нейронными сетями (пример)

Целью проекта является исследование зависимости качества прогнозирования нейронными сетями без обратной связи (одно- и многослойными перцептронами) от выбранной функции активации нейронов в сети, а также от параметров этой функции, при наличии таковых.

Функция активации определяет сигнал на выходе нейрона в зависимости от результата работы сумматора на входе нейрона. Как правило, функция активации имеет область определения (-\infty; \infty) и область значений [0; 1]. В простейшем случае, изначально предложенном и моделирующим биологический нейрон, функция активации представляет собой функцию Хевисайда:

f(x) = \begin{cases}1 & x \geq x_0\\0 & x < x_0\end{cases}

При дальнейшем развитии нейронных сетей оказалось полезным использование непрерывных функций, таких как логистическая функция \sigma(x) = \frac{1}{1+e^{-tx}} и другие функции-сигмоиды (f(x) = \frac{x}{x+\alpha}) и немонотонные функции, такие как тригонометрический синус.

Результатом проекта является оценка качества прогнозирования нейронными сетями в зависимости от типа и параметров функции активации.

Задача 12: Исследование сходимости при прогнозировании нейронными сетями с боратной связью (пример)

Цель проекта - иследовать зависимость сходимости прогнозирования от параметров нейронной сети. Понятие обратной связи характерно для динамических систем, в которой выходной сигнал некоторого элемента истемы оказыает влияние на входной сигнал этого элемента. Входной Сигнал x_{j}(n), внутренний сигнал x_{j}^{'}(n) и выходной сигнал y_{j}(n) связаны соотношениями

Задача 13: Многомерная гусеница, выбор временных рядов при прогнозировании(пример)

Работа посвящена исследованию одного из методов анализа многомерных временных рядов - метода "гусеницы", также известного как Singular Spectrum Analysis или SSA. Метод можно разделить на четыре этапа - представление временного ряда в виде матрицы при помощи сдвиговой процедуры, вычисление ковариационной матрицы выборки и сингулярное ее разложение, отбор главных компонент,относящихся к различным составляющим ряда (от медленно меняющихся и периодических до шумовых), и, наконец, восстановление ряда.

Областью применения алгоритма являются задачи как метеорологии и геофизики, так и экономики и медицины. Целью данной работы является выяснение зависимости эффективности алгоритма от выбора временных рядов, используемых в его работе.

Доклады и экзамен (возможны уточнения)

  • Доклад-1 6 апреля
  • Контрольная точка 18 мая
  • Экзамен 25 мая

Список задач, черновик

  1. Непараметрическое прогнозирование (выбор ядра из набора, настройка параметров)
  2. Прогнозирование и экспоненциальное сглаживание (набор временных рядов, исследование современного состояния)
  3. Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж)
  4. Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда)
  5. Многомерная гусеница, выбор временных рядов при прогнозировании
  6. Многомерная авторегрессия
  7. Локальные методы прогнозирования, поиск метрики
  8. Локальные методы прогнозирования, поиск инвариантного преобразования
  9. Прогнозирование с использованием пути наименьшей стоимости (DTW)
  10. Выбор функции активации при прогнозировании нейронными сетями
  11. Выбор ядра при прогнозировании функциями радиального базиса
  12. Исследование сходимости при прогнозировании нейронными сетями с обратной связью
  13. Прогнозирование функциями дискретного аргумента
  14. Прогнозирование с использованием теста Гренжера
  15. Прогнозирование и SVN – регрессия
  16. ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)
  17. Прогнозирование и аппроксимация сплайнами
Личные инструменты