Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 874, весна 2011

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Задачи)
м
 
(78 промежуточных версий не показаны.)
Строка 6: Строка 6:
* [[Отчет о выполнении исследовательского проекта (практика, В.В. Стрижов)|Отчет о выполнении исследовательского проекта]]
* [[Отчет о выполнении исследовательского проекта (практика, В.В. Стрижов)|Отчет о выполнении исследовательского проекта]]
* [[Автоматизация и стандартизация научных исследований (практика, В.В. Стрижов)|Автоматизация и стандартизация научных исследований]]
* [[Автоматизация и стандартизация научных исследований (практика, В.В. Стрижов)|Автоматизация и стандартизация научных исследований]]
 +
 +
См. также
 +
* [[Временной ряд (библиотека примеров)]]
== Задачи ==
== Задачи ==
Строка 13: Строка 16:
! Работу выполняет
! Работу выполняет
! Работу рецензирует
! Работу рецензирует
 +
! Ссылка на работу
! Комментарии
! Комментарии
|-
|-
-
| [[Прогнозирование с использованием теста Гренжера (пример)]]
+
| Использование теста Гренджера при прогнозировании временных рядов
| Анастасия Мотренко
| Анастасия Мотренко
-
|
+
| Любовь Леонтьева
-
|
+
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group874/Motrenko2011GrangerForc Motrenko2011GrangerForc]
 +
| Опубл. в JMLDA
|-
|-
-
| [[Выбор функции активации при прогнозировании нейронными сетями (пример)]]
+
| Выбор функции активации при прогнозировании нейронными сетями
| Георгий Рудой
| Георгий Рудой
| Николай Балдин
| Николай Балдин
-
|
+
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group874/Rudoy2011NNForecasting Rudoy2011NNForecasting]
 +
| Опубл. в JMLDA
|-
|-
-
| [[Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)]]
+
| [[Многомерная гусеница, выбор длины и числа компонент гусеницы (пример)]]
| Любовь Леонтьева
| Любовь Леонтьева
| Михаил Бурмистров
| Михаил Бурмистров
-
|
+
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group874/Leonteva2011GaterpillarLearning Leonteva2011GaterpillarLearning]
 +
| Опубл. в JMLDA
|-
|-
| [[Прогнозирование функциями дискретного аргумента (пример)]]
| [[Прогнозирование функциями дискретного аргумента (пример)]]
| Егор Будников
| Егор Будников
| Александр Романенко
| Александр Романенко
-
|
+
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group874/Budnikov2011DiscreteForecasting Budnikov2011DiscreteForecasting]
 +
| Опубл. в JMLDA
|-
|-
-
| [[Исследование сходимости при прогнозировании нейронными сетями с обратной связью (пример)]]
+
| Исследование сходимости при прогнозировании нейронными сетями с обратной связью
-
| Николай Балдин
+
| [[Участник:nkgrin|Николай Балдин]]
| Георгий Рудой
| Георгий Рудой
-
|
+
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group874/Baldin2011FNNForecasting Baldin2011FNNForecasting]
 +
| Опубл. в JMLDA
|-
|-
-
| [[Непараметрическое прогнозирование: выбор ядра из набора, настройка параметров (пример)]]
+
| Выравнивание временных рядов: прогнозирование с использованием DTW (пример)|Выравнивание временных рядов: прогнозирование с использованием DTW
-
| Михаил Кокшаров
+
| Александр Романенко
-
|
+
| Егор Будников
-
|
+
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group874/Romanenko2011DTWForecasting Romanenko2011DTWForecasting]
 +
| Опубл. в JMLDA
|-
|-
-
|[[Экспоненциальное сглаживание и прогноз (пример)]]
+
|[[Выделение периодической компоненты временного ряда (пример)]]
-
|Бурмистров Михаил
+
| Александра Токмакова
-
|
+
| Егор Будников
-
|
+
| [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group874/Tokmakova2011Periodic Tokmakova2011Periodic]
-
|-
+
| Опубл. в JMLDA
-
|[[Выравнивание временных рядов: прогнозирование с использованием DTW (пример)]]
+
-
|Романенко Александр
+
-
|Егор Будников
+
-
|
+
-
|-
+
-
|[[Многомерная авторегрессия (пример)]]
+
-
|Ямщиков Илья
+
-
|
+
-
|
+
-
|-
+
-
|[[Локальные методы прогнозирования,поиск метрики (пример)]]
+
-
|Евгений Гребенников
+
-
|Михаил Кокшаров
+
-
|
+
-
|-
+
-
|[[Локальные методы прогнозирования,поиск инвариантного преобразования (пример)]]
+
-
|Юлия Хаспулатова
+
-
|
+
-
|
+
-
|-
+
-
|[[Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж)]]
+
-
|Токмакова Александра
+
-
|Егор Будников
+
-
|
+
-
|-
+
-
|[[Многомерная гусеница, выбор временных рядов при прогнозировании(пример)]]
+
-
|Элина Торчинская
+
-
|
+
-
|
+
-
|-
+
-
|[[Прогнозирование и аппроксимация сплайнами]]
+
-
|Мищенко Павел
+
-
|
+
-
|
+
-
|-
+
-
|[[ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)(пример)]]
+
-
|Ганусевич Ирина
+
-
|
+
-
|
+
-
|-
+
-
|[[Прогнозирование и SVN – регрессия(пример)]]
+
-
|Ситник Александр
+
-
|
+
-
|
+
|-
|-
|}
|}
-
 
-
{{tip|В конце названия слово "(пример)" является ключевым и означает "пример работы алгоритма".}}
 
==Краткое описание задач==
==Краткое описание задач==
-
=== [[Краткосрочное прогнозирование почасовых цен на электроэнергию (пример)]] ===
 
-
Описание задачи.
 
-
=== Задача 2: [[Экспоненциальное сглаживание и прогноз (пример)]] ===
+
=== Задача 1: Непараметрическое прогнозирование: выбор ядра, настройка параметров ===
-
Прогнозирование методом экспоненциальной регрессии является идейно простым алгоритмом прогнозирования временных рядов. Идея метода основана на учете предшествующих значений ряда с убывающими весами. В своей простейшей реализации алгоритм сильно сглаживает ряд и плохо учитывает тренды, сезонность и резкие изменения в тренде, а также необоснованно заметно реагирует на выбросы в данных. Предполагается изучение и реализация алгоритмов, пытающихся найти оптимальную модель путем минимизации ошибки на известном временном ряду.
+
В работе описывается метод ядерного сглаживания временного ряда, как один из видов непараметрической регрессии. Суть метода
 +
состоит в восстановлении функции времени, как взвешенной линейной комбинации точек из некоторой окрестности. Непрерывную ограниченную симметричную вещественную весовую функцию называют ядром. Полученная ядерная оценка используется для прогнозирования следующей точки ряда. Исследуется зависимость качества прогнозирования от параметров ядра и наложенного шума.
 +
 +
=== Задача 2: Экспоненциальное сглаживание и прогноз ===
 +
В работе исследуется применение алгоритма экспоненциального сглаживания к прогнозированию временных рядов. В основе алгоритма лежит учет предыдущих значений ряда с весами, убывающими по мере удаления от исследуемого участка временного ряда. Изучено поведение алгоритма на модельных данных в различных моделях весов. Проведен анализ работы алгоритма на реальных данных -– биржевых индексах.
-
=== Задача 3: [[Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж) (пример)]] ===
+
=== Задача 3: [[Выделение периодической компоненты временного ряда (пример)]] ===
-
Целью проекта является нахождение закономерности в определённом процессе и сравнение базового алгоритма, проводящего прогнозирование с помощью скользящего среднего, с алгоритмом, учитывающим цикличность задачи. Также необходимо исследовать различные флуктуации входящих параметров и минимизировать при этом отклонения.
+
В проекте исследуется временной ряд на наличие периодической компоненты, строится тригонометрическая интерполяция предложенных временных рядов методом наименьших квадратов. Производится оценка параметров функции метода наименьших квадратов в зависимости от качества прогнозирования. В вычислительном эксперименте приводятся результаты работы корреляционной функции и метода наименьших квадратов на зашумлённом модельном синусе и реальном временном ряде электрокардиограммы.
-
Данный алгоритм можно использовать при прогнозировании цен, объёмов продаж, туристических потоков – любых процессов, подразумевающих наличие временных рядов с периодической составляющей. Алгоритм не предусмотрен для работы в авральных ситуациях, таких как: промо-акции, праздники и т.д. - данные ситуации описываются отдельной задачей. Результатом проекта является оценка эффективности алгоритма, учитывающего цикличность задачи.
+
===Задача 4: Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)===
-
===Задача 4: [[Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)]]===
+
В работе описывается метод гусеницы и его применение для прогнозирования временных рядов. Алгоритм основан на выделении из изучаемого временного ряда его информативных компонент и последующего построения прогноза. Исследуется зависимость точности прогнозов от выбора длины гусеницы и числа ее компонент. В вычислительном эксперименте приводятся результаты работы алгоритма на периодических рядах с разным рисунком внутри периода, на рядах с нарушением периодичности, а так же на реальных рядах почасовой температуры.
-
Требуется исследовать SSA-алгоритм (метод гусеницы) для многомерных временных рядов. Метод заключается в преобразовании ряда с помощью однопараметрической сдвиговой процедуры с последующим исследованием полученной траектории с помощью анализа главных компонент и восстановлением ряда по выбранным главным компонентам. В работе будет исследован вопрос выбора длины гусеницы и числа ее компонент, т.е. то, как определить по полученному разложению на компоненты, какие из них являются неинформативными (шумы). Также метод помогает увидеть и выделить разного рода закономерности в поведении временных рядов.
+
===Задача 5: [[Прогнозирование функциями дискретного аргумента (пример)]] ===
-
+
-
Результатом работы является выяснение эффективности работы алгоритма в зависимости от длины и числа компонент гусеницы, а также выяснение возможностей алгоритма и его области применимости.
+
-
 
+
-
 
+
-
===Задача 5: [[Прогнозирование функциями дискретного аргумента (пример)]]===
+
-
 
+
-
Дана функция дискретного аргумента. Требуется найти функцию f из некоторого параметрическую семейства, например, среди алгебраических полиномов заданной степени. Параметры функции f должны доставлять минимум некоторому функционалу.
+
-
В работе будут анализироваться монофонические мелодии.
+
В работе исследуются короткие временные ряды на примере монофонических музыкальных мелодий. Происходит прогнозирование одной ноты экспоненциальным сглаживанием, локальным методом, а также методом поиска постоянных закономерностей.
 +
Вычислительный эксперимент проводится на двух мелодиях, одна из которых имеет точно повторяющиеся фрагменты.
-
===Задача 7: [[Локальные методы прогнозирования,поиск метрики (пример)]]===
+
===Задача 7: Локальные методы прогнозирования,поиск метрики ===
Временной ряд делится на отдельные участки, каждому из которых сопоставляется точка в n-мерном пространстве признаков. Локальная модель рассчитывается в три последовательных этапа.
Временной ряд делится на отдельные участки, каждому из которых сопоставляется точка в n-мерном пространстве признаков. Локальная модель рассчитывается в три последовательных этапа.
Первый – находит k-ближайших соседей наблюдаемой точки.
Первый – находит k-ближайших соседей наблюдаемой точки.
Второй – строит простую модель, используя только этих k соседей.
Второй – строит простую модель, используя только этих k соседей.
-
Третий – используя даную модель, по наблюдаемой точке прогнозирует следующую.
+
Третий – используя данную модель, по наблюдаемой точке прогнозирует следующую.
Многие исследователи, используют эвклидову метрику для измерения расстояний между точками.
Многие исследователи, используют эвклидову метрику для измерения расстояний между точками.
Данная работа призвана сравнить точность прогнозирования при использовании различных метрик.
Данная работа призвана сравнить точность прогнозирования при использовании различных метрик.
В частности, требуется исследовать оптимальный набор весов во взвешенной метрике для максимизации точности прогнозирования.
В частности, требуется исследовать оптимальный набор весов во взвешенной метрике для максимизации точности прогнозирования.
-
===Задача 8: [[Локальные методы прогнозирования, поиск инвариантного преобразования (пример)]]===
+
===Задача 8: Локальные методы прогнозирования, поиск инвариантного преобразования ===
В проекте используются локальные методы прогнозирования
В проекте используются локальные методы прогнозирования
-
временных рядов. Эти методы отказываются от нахождения представления временного
+
временных рядов. В этих методах не находится представления временного
ряда в классе заданных функций от времени. Вместо этого прогноз осуществляется на
ряда в классе заданных функций от времени. Вместо этого прогноз осуществляется на
-
основе данных о каком-то участке временного ряда (используется локальная
+
основе данных о каком-то участке временного ряда (используется локальная информация).
В данной работе подробно исследован следующий метод (обобщение классического
В данной работе подробно исследован следующий метод (обобщение классического
«ближайшего соседа»).
«ближайшего соседа»).
-
Пусть имеется временной ряд, и стоит задача требуется продолжить его. Предполагается, что такое продолжение определяется
+
Пусть имеется временной ряд, и стоит задача продолжить его. Предполагается, что такое продолжение определяется
-
«предысторией», т.е. в ряде нужно найти часть, которая после
+
предысторией, т.е. в ряде нужно найти часть, которая после
-
некоторого преобразования A «становится похожа» на ту часть, которую мы стремимся прогнозировать. Поиск такого преобразования A и есть цель данного проекта. Для определения степени «похожести» используется метрика B – функция близости двух отрезков
+
некоторого преобразования A становится схожа с той частью, которую мы стремимся прогнозировать. Поиск такого преобразования A и есть цель данного проекта. Для определения степени сходства используется функция B – функция близости двух отрезков
-
временного ряда (подробнее об этом см.[[Локальные методы прогнозирования,поиск метрики (пример)]]). Так мы находим ближайшего соседа к нашей предыстории. В общем случае ищем несколько
+
временного ряда (подробнее об этом см. [http://www.machinelearning.ru/wiki/index.php?title=%D0%9B%D0%BE%D0%BA%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B5_%D0%BC%D0%B5%D1%82%D0%BE%D0%B4%D1%8B_%D0%BF%D1%80%D0%BE%D0%B3%D0%BD%D0%BE%D0%B7%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F%2C%D0%BF%D0%BE%D0%B8%D1%81%D0%BA_%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%BA%D0%B8_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29&action=edit здесь]). Так мы находим ближайшего соседа к нашей предыстории. В общем случае ищем несколько
ближайших соседей. Продолжение запишется в виде их линейной комбинации.
ближайших соседей. Продолжение запишется в виде их линейной комбинации.
-
=== Задача 9: [[Выравнивание временных рядов: прогнозирование с использованием DTW (пример)]] ===
+
=== Задача 9: Выравнивание временных рядов: прогнозирование с использованием DTW (пример) ===
[[временной ряд|Временным рядом]] называется последовательность упорядоченных по времени значений некоторой вещественной переменной <tex>$\mathbf{x}=\{x_{t}\}_{t=1}^T\in\mathbb{R}^T$</tex>. Задача, сопутствующая появлению временных рядов, - сравнение одной последовательности данных с другой. Сравнение последовательностей существенно упрощается после деформации временного ряда вдоль одной из осей и его выравнивания. Dynamic time warping (DTW) представляет собой технику эффективного выравнивая временных рядов. Методы DTW используются при распознавании речи, при анализе информации в робототехнике, в промышленности, в медицине и других сферах.
[[временной ряд|Временным рядом]] называется последовательность упорядоченных по времени значений некоторой вещественной переменной <tex>$\mathbf{x}=\{x_{t}\}_{t=1}^T\in\mathbb{R}^T$</tex>. Задача, сопутствующая появлению временных рядов, - сравнение одной последовательности данных с другой. Сравнение последовательностей существенно упрощается после деформации временного ряда вдоль одной из осей и его выравнивания. Dynamic time warping (DTW) представляет собой технику эффективного выравнивая временных рядов. Методы DTW используются при распознавании речи, при анализе информации в робототехнике, в промышленности, в медицине и других сферах.
Строка 154: Строка 114:
Цель работы - привести пример выравнивания, ввести функционал сравнения двух временных рядов, обладающий естественными свойствами коммутативности, рефлексивности и транзитивностина. Функционал должен принимать на вход два временных ряда, а на выходе давать число, характеризующее степень их "похожести".
Цель работы - привести пример выравнивания, ввести функционал сравнения двух временных рядов, обладающий естественными свойствами коммутативности, рефлексивности и транзитивностина. Функционал должен принимать на вход два временных ряда, а на выходе давать число, характеризующее степень их "похожести".
-
=== Задача 10: [[Выбор функции активации при прогнозировании нейронными сетями (пример)]] ===
+
=== Задача 10: Выбор функции активации при прогнозировании нейронными сетями===
-
Целью проекта является исследование зависимости качества прогнозирования нейронными сетями без обратной связи (одно- и многослойными перцептронами) от выбранной функции активации нейронов в сети, а также от параметров этой функции, при наличии таковых.
+
Целью проекта является исследование зависимости качества прогнозирования нейронными сетями без обратной связи (одно- и многослойными перцептронами) от выбранной функции активации нейронов в сети, а также от параметров этой функции.
-
Функция активации определяет сигнал на выходе нейрона в зависимости от результата работы сумматора на входе нейрона. Как правило, функция активации имеет область определения <tex>(-\infty; \infty)</tex> и область значений <tex>[0; 1]</tex>. В простейшем случае, изначально предложенном и моделирующим биологический нейрон, функция активации представляет собой функцию Хевисайда:
+
Результатом проекта является оценка качества прогнозирования нейронными сетями в зависимости от типа и параметров функции активации.
-
<tex>f(x) = \begin{cases}1 & x \geq x_0\\0 & x < x_0\end{cases}</tex>
+
===Задача 12: Исследование сходимости при прогнозировании нейронными сетями с обратной связью===
-
При дальнейшем развитии нейронных сетей оказалось полезным использование непрерывных функций, таких как логистическая функция <tex>\sigma(x) = \frac{1}{1+e^{-tx}}</tex> и другие функции-сигмоиды (<tex>f(x) = \frac{x}{x+\alpha}</tex>) и немонотонные функции, такие как тригонометрический синус.
+
Исследуется зависимость скорости сходимости при прогнозировании временных рядов от параметров нейронной сети с обратной связью. Понятие обратной связи характерно для динамических систем, в которых выходной сигнал некоторого элемента cистемы
 +
оказывает влияние на входной сигнал этого элемента. Выходной сигнал можно представить в виде бесконечной взвешенной
 +
суммы текущего и предыдущих входных сигналов. В качестве модели нейронной сети используется сеть Джордана.
 +
Предлагается исследовать скорость сходимости в зависимости от выбора функции активации (сигмоидной,
 +
гиперболического тангенса), от числа нейронов в промежуточном слое и от ширины скользящего окна.
 +
Также исследуется способ повышения скорости сходимости при использовании обобщенного дельта-правила.
-
Результатом проекта является оценка качества прогнозирования нейронными сетями в зависимости от типа и параметров функции активации.
+
===Задача 13: [[Многомерная гусеница, выбор длины и числа компонент гусеницы (пример)]]===
-
===Задача 12: [[Исследование сходимости при прогнозировании нейронными сетями с обратной связью (пример)]]===
+
Работа посвящена исследованию одного из методов анализа многомерных временных рядов - метода "гусеницы", также известного как Singular Spectrum Analysis или SSA. Метод можно разделить на четыре этапа - представление временного ряда в виде матрицы при помощи сдвиговой процедуры, вычисление ковариационной матрицы выборки и сингулярное ее разложение, отбор главных компонент,относящихся к различным составляющим ряда (от медленно меняющихся и периодических до шумовых), и, наконец, восстановление ряда.
-
Цель проекта - исследовать зависимость сходимости прогнозирования от параметров нейронной сети. Понятие обратной связи характерно для динамических систем, в которых выходной сигнал некоторого элемента cистемы оказывает влияние на входной сигнал этого элемента. Входной cигнал <tex>x_{j}(n)</tex>, внутренний сигнал <tex>x_{j}^{'}(n)</tex> и выходной сигнал <tex>y_{j}(n)</tex> связаны соотношениями: <tex>y_{k}(n) = A[x_{j}^{'}(n)]</tex> ; <tex>x_{j}^{'}(n) = x_{j}(n) + B[y_{j}(n)] </tex>, где A и B - опреаторы. Предполагается, что A - это фиксированный вес, а B - это оператор единичной задержки <tex>z^{-1}</tex>. Отсюда <tex>y_{k}(n) = \sum_{l=0}^\infty\ w^{l+1}z^{-l}[x_{j}(n)]</tex>, где <tex>z^{-l}[x_{j}(n)] = x_{j}(n-l)</tex>.
+
Областью применения алгоритма являются задачи как метеорологии и геофизики, так и экономики и медицины. Целью данной работы является выяснение зависимости эффективности алгоритма от выбора временных рядов, используемых в его работе.
-
Выходной сигнал можно представить в виде бесконечной взвешенной суммы текущего и предыдущих входных сигналов. При <tex>|w| < 1</tex> выходной сигнал экспоненциально сходится.
+
-
Нужно исследовать какие факторы с каким весов влияют на w.
+
-
===Задача 13: [[Многомерная гусеница, выбор временных рядов при прогнозировании(пример)]]===
+
===Задача 14: Использование теста Гренджера при прогнозировании временных рядов===
-
Работа посвящена исследованию одного из методов анализа многомерных временных рядов - метода "гусеницы", также известного как Singular Spectrum Analysis или SSA. Метод можно разделить на четыре этапа - представление временного ряда в виде матрицы при помощи сдвиговой процедуры, вычисление ковариационной матрицы выборки и сингулярное ее разложение, отбор главных компонент,относящихся к различным составляющим ряда (от медленно меняющихся и периодических до шумовых), и, наконец, восстановление ряда.
+
При прогнозировании ряда бывает полезно определить, является ли данный ряд "зависимым" от некоторого другого ряда. Выявить подобную связь помогает тест Грейнджера, основанный на статистических тестах(при этом метод не гарантирует точного результата - при сравнении двух рядов, зависящих от еще одного ряда возможна ошибка). Метод применяется при прогнозировании экономических явлений и явлений природного характера (например, землятрясений).
-
Областью применения алгоритма являются задачи как метеорологии и геофизики, так и экономики и медицины. Целью данной работы является выяснение зависимости эффективности алгоритма от выбора временных рядов, используемых в его работе.
+
Цель работы - предложить алгоритм, наилучшим образом использующий данный метод; исследовать эффективность метода в зависимости от прогнозируемых рядов.
 +
 
 +
===Задача 15: Прогнозирование и аппроксимация сплайнами===
 +
Описание.
 +
 
 +
===Задача 16: ARIMA и GARCH при прогнозировании высоковолатильных рядов ===
 +
Описание.
 +
 
 +
===Задача 17: Прогнозирование и SVN–регрессия ===
 +
Описание.
== Доклады и экзамен (возможны уточнения) ==
== Доклады и экзамен (возможны уточнения) ==
* Доклад-1 6 апреля
* Доклад-1 6 апреля
-
* Контрольная точка 18 мая
+
* Контрольная точка 12 мая
-
* Экзамен 25 мая
+
* Экзамен 19 мая
== Список задач, черновик ==
== Список задач, черновик ==
Строка 198: Строка 170:
# Исследование сходимости при прогнозировании нейронными сетями с обратной связью
# Исследование сходимости при прогнозировании нейронными сетями с обратной связью
# Прогнозирование функциями дискретного аргумента
# Прогнозирование функциями дискретного аргумента
-
# Прогнозирование с использованием теста Гренжера
+
# Использование теста Гренджера при прогнозировании временных рядов
# Прогнозирование и SVN – регрессия
# Прогнозирование и SVN – регрессия
# ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)
# ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)
# Прогнозирование и аппроксимация сплайнами
# Прогнозирование и аппроксимация сплайнами
 +
# Изображение:JokeExam486in2011Spring.png|150px|right|frame|Экзамен-шутка: результаты
[[Категория:Учебные курсы]]
[[Категория:Учебные курсы]]

Текущая версия


Перед выполнением заданий рекомендуются к прочтению

См. также

Задачи

Название задачи Работу выполняет Работу рецензирует Ссылка на работу Комментарии
Использование теста Гренджера при прогнозировании временных рядов Анастасия Мотренко Любовь Леонтьева Motrenko2011GrangerForc Опубл. в JMLDA
Выбор функции активации при прогнозировании нейронными сетями Георгий Рудой Николай Балдин Rudoy2011NNForecasting Опубл. в JMLDA
Многомерная гусеница, выбор длины и числа компонент гусеницы (пример) Любовь Леонтьева Михаил Бурмистров Leonteva2011GaterpillarLearning Опубл. в JMLDA
Прогнозирование функциями дискретного аргумента (пример) Егор Будников Александр Романенко Budnikov2011DiscreteForecasting Опубл. в JMLDA
Исследование сходимости при прогнозировании нейронными сетями с обратной связью Николай Балдин Георгий Рудой Baldin2011FNNForecasting Опубл. в JMLDA
Выравнивание временных рядов: прогнозирование с использованием DTW Александр Романенко Егор Будников Romanenko2011DTWForecasting Опубл. в JMLDA
Выделение периодической компоненты временного ряда (пример) Александра Токмакова Егор Будников Tokmakova2011Periodic Опубл. в JMLDA

Краткое описание задач

Задача 1: Непараметрическое прогнозирование: выбор ядра, настройка параметров

В работе описывается метод ядерного сглаживания временного ряда, как один из видов непараметрической регрессии. Суть метода состоит в восстановлении функции времени, как взвешенной линейной комбинации точек из некоторой окрестности. Непрерывную ограниченную симметричную вещественную весовую функцию называют ядром. Полученная ядерная оценка используется для прогнозирования следующей точки ряда. Исследуется зависимость качества прогнозирования от параметров ядра и наложенного шума.

Задача 2: Экспоненциальное сглаживание и прогноз

В работе исследуется применение алгоритма экспоненциального сглаживания к прогнозированию временных рядов. В основе алгоритма лежит учет предыдущих значений ряда с весами, убывающими по мере удаления от исследуемого участка временного ряда. Изучено поведение алгоритма на модельных данных в различных моделях весов. Проведен анализ работы алгоритма на реальных данных -– биржевых индексах.

Задача 3: Выделение периодической компоненты временного ряда (пример)

В проекте исследуется временной ряд на наличие периодической компоненты, строится тригонометрическая интерполяция предложенных временных рядов методом наименьших квадратов. Производится оценка параметров функции метода наименьших квадратов в зависимости от качества прогнозирования. В вычислительном эксперименте приводятся результаты работы корреляционной функции и метода наименьших квадратов на зашумлённом модельном синусе и реальном временном ряде электрокардиограммы.

Задача 4: Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)

В работе описывается метод гусеницы и его применение для прогнозирования временных рядов. Алгоритм основан на выделении из изучаемого временного ряда его информативных компонент и последующего построения прогноза. Исследуется зависимость точности прогнозов от выбора длины гусеницы и числа ее компонент. В вычислительном эксперименте приводятся результаты работы алгоритма на периодических рядах с разным рисунком внутри периода, на рядах с нарушением периодичности, а так же на реальных рядах почасовой температуры.

Задача 5: Прогнозирование функциями дискретного аргумента (пример)

В работе исследуются короткие временные ряды на примере монофонических музыкальных мелодий. Происходит прогнозирование одной ноты экспоненциальным сглаживанием, локальным методом, а также методом поиска постоянных закономерностей. Вычислительный эксперимент проводится на двух мелодиях, одна из которых имеет точно повторяющиеся фрагменты.

Задача 7: Локальные методы прогнозирования,поиск метрики

Временной ряд делится на отдельные участки, каждому из которых сопоставляется точка в n-мерном пространстве признаков. Локальная модель рассчитывается в три последовательных этапа. Первый – находит k-ближайших соседей наблюдаемой точки. Второй – строит простую модель, используя только этих k соседей. Третий – используя данную модель, по наблюдаемой точке прогнозирует следующую. Многие исследователи, используют эвклидову метрику для измерения расстояний между точками. Данная работа призвана сравнить точность прогнозирования при использовании различных метрик. В частности, требуется исследовать оптимальный набор весов во взвешенной метрике для максимизации точности прогнозирования.

Задача 8: Локальные методы прогнозирования, поиск инвариантного преобразования

В проекте используются локальные методы прогнозирования временных рядов. В этих методах не находится представления временного ряда в классе заданных функций от времени. Вместо этого прогноз осуществляется на основе данных о каком-то участке временного ряда (используется локальная информация). В данной работе подробно исследован следующий метод (обобщение классического «ближайшего соседа»).

Пусть имеется временной ряд, и стоит задача продолжить его. Предполагается, что такое продолжение определяется предысторией, т.е. в ряде нужно найти часть, которая после некоторого преобразования A становится схожа с той частью, которую мы стремимся прогнозировать. Поиск такого преобразования A и есть цель данного проекта. Для определения степени сходства используется функция B – функция близости двух отрезков временного ряда (подробнее об этом см. здесь). Так мы находим ближайшего соседа к нашей предыстории. В общем случае ищем несколько ближайших соседей. Продолжение запишется в виде их линейной комбинации.

Задача 9: Выравнивание временных рядов: прогнозирование с использованием DTW (пример)

Временным рядом называется последовательность упорядоченных по времени значений некоторой вещественной переменной $\mathbf{x}=\{x_{t}\}_{t=1}^T\in\mathbb{R}^T$. Задача, сопутствующая появлению временных рядов, - сравнение одной последовательности данных с другой. Сравнение последовательностей существенно упрощается после деформации временного ряда вдоль одной из осей и его выравнивания. Dynamic time warping (DTW) представляет собой технику эффективного выравнивая временных рядов. Методы DTW используются при распознавании речи, при анализе информации в робототехнике, в промышленности, в медицине и других сферах.

Цель работы - привести пример выравнивания, ввести функционал сравнения двух временных рядов, обладающий естественными свойствами коммутативности, рефлексивности и транзитивностина. Функционал должен принимать на вход два временных ряда, а на выходе давать число, характеризующее степень их "похожести".

Задача 10: Выбор функции активации при прогнозировании нейронными сетями

Целью проекта является исследование зависимости качества прогнозирования нейронными сетями без обратной связи (одно- и многослойными перцептронами) от выбранной функции активации нейронов в сети, а также от параметров этой функции.

Результатом проекта является оценка качества прогнозирования нейронными сетями в зависимости от типа и параметров функции активации.

Задача 12: Исследование сходимости при прогнозировании нейронными сетями с обратной связью

Исследуется зависимость скорости сходимости при прогнозировании временных рядов от параметров нейронной сети с обратной связью. Понятие обратной связи характерно для динамических систем, в которых выходной сигнал некоторого элемента cистемы оказывает влияние на входной сигнал этого элемента. Выходной сигнал можно представить в виде бесконечной взвешенной суммы текущего и предыдущих входных сигналов. В качестве модели нейронной сети используется сеть Джордана. Предлагается исследовать скорость сходимости в зависимости от выбора функции активации (сигмоидной, гиперболического тангенса), от числа нейронов в промежуточном слое и от ширины скользящего окна. Также исследуется способ повышения скорости сходимости при использовании обобщенного дельта-правила.

Задача 13: Многомерная гусеница, выбор длины и числа компонент гусеницы (пример)

Работа посвящена исследованию одного из методов анализа многомерных временных рядов - метода "гусеницы", также известного как Singular Spectrum Analysis или SSA. Метод можно разделить на четыре этапа - представление временного ряда в виде матрицы при помощи сдвиговой процедуры, вычисление ковариационной матрицы выборки и сингулярное ее разложение, отбор главных компонент,относящихся к различным составляющим ряда (от медленно меняющихся и периодических до шумовых), и, наконец, восстановление ряда.

Областью применения алгоритма являются задачи как метеорологии и геофизики, так и экономики и медицины. Целью данной работы является выяснение зависимости эффективности алгоритма от выбора временных рядов, используемых в его работе.

Задача 14: Использование теста Гренджера при прогнозировании временных рядов

При прогнозировании ряда бывает полезно определить, является ли данный ряд "зависимым" от некоторого другого ряда. Выявить подобную связь помогает тест Грейнджера, основанный на статистических тестах(при этом метод не гарантирует точного результата - при сравнении двух рядов, зависящих от еще одного ряда возможна ошибка). Метод применяется при прогнозировании экономических явлений и явлений природного характера (например, землятрясений).

Цель работы - предложить алгоритм, наилучшим образом использующий данный метод; исследовать эффективность метода в зависимости от прогнозируемых рядов.

Задача 15: Прогнозирование и аппроксимация сплайнами

Описание.

Задача 16: ARIMA и GARCH при прогнозировании высоковолатильных рядов

Описание.

Задача 17: Прогнозирование и SVN–регрессия

Описание.

Доклады и экзамен (возможны уточнения)

  • Доклад-1 6 апреля
  • Контрольная точка 12 мая
  • Экзамен 19 мая

Список задач, черновик

  1. Непараметрическое прогнозирование (выбор ядра из набора, настройка параметров)
  2. Прогнозирование и экспоненциальное сглаживание (набор временных рядов, исследование современного состояния)
  3. Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж)
  4. Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда)
  5. Многомерная гусеница, выбор временных рядов при прогнозировании
  6. Многомерная авторегрессия
  7. Локальные методы прогнозирования, поиск метрики
  8. Локальные методы прогнозирования, поиск инвариантного преобразования
  9. Прогнозирование с использованием пути наименьшей стоимости (DTW)
  10. Выбор функции активации при прогнозировании нейронными сетями
  11. Выбор ядра при прогнозировании функциями радиального базиса
  12. Исследование сходимости при прогнозировании нейронными сетями с обратной связью
  13. Прогнозирование функциями дискретного аргумента
  14. Использование теста Гренджера при прогнозировании временных рядов
  15. Прогнозирование и SVN – регрессия
  16. ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)
  17. Прогнозирование и аппроксимация сплайнами
  18. Изображение:JokeExam486in2011Spring.png|150px|right|frame|Экзамен-шутка: результаты
Личные инструменты