Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 874, весна 2011

Материал из MachineLearning.

Перейти к: навигация, поиск


Перед выполнением заданий рекомендуются к прочтению

Задачи

Название задачи Работу выполняет Работу рецензирует Ссылка на работу Комментарии
Прогнозирование с использованием теста Гренжера (пример) Анастасия Мотренко Любовь Леонтьева GrangerForcasting
Выбор функции активации при прогнозировании нейронными сетями (пример) Георгий Рудой Николай Балдин NNForecasting
Многомерная гусеница, выбор длины и числа компонент гусеницы (пример) Любовь Леонтьева Михаил Бурмистров GaterpillarLearning
Прогнозирование функциями дискретного аргумента (пример) Егор Будников Александр Романенко DiscreteForecasting
Исследование сходимости при прогнозировании нейронными сетями с обратной связью (пример) Николай Балдин Георгий Рудой FNNForecasting
Непараметрическое прогнозирование: выбор ядра, настройка параметров (пример) Михаил Кокшаров Александра Токмакова NonparametricForecasting
Экспоненциальное сглаживание и прогноз (пример) Михаил Бурмистров Юлия Хаспулатова ExponentialForecasting
Выравнивание временных рядов: прогнозирование с использованием DTW (пример) Александр Романенко Егор Будников DTWForcasting
Многомерная авторегрессия (пример) Илья Ямщиков Анастасия Мотренко MutivariateAutoregression
Локальные методы прогнозирования, поиск метрики (пример) Евгений Гребенников Михаил Кокшаров LocalForecastingAndMetrics
Локальные методы прогнозирования, поиск инвариантного преобразования (пример) Юлия Хаспулатова Евгений Гребенников LocalForecastingAndInvariants
Выявление периодической компоненты временных рядов при помощи автокорреляционной функции и разложения в ряд Фурье (пример) Александра Токмакова Егор Будников ComparingAutocorrelationFourierSeries
Многомерная гусеница, выбор временных рядов при прогнозировании (пример) Элина Торчинская MultivaliateCaterpillar
Прогнозирование и аппроксимация сплайнами (пример) Павел Мищенко SplineForecasting
ARIMA и GARCH при прогнозировании высоковолатильных рядов (пример) Ирина Ганусевич ARIMAandGARCH
Прогнозирование и SVN–регрессия (пример) Александр Ситник SVNForecasting

Краткое описание задач

Задача 1: Непараметрическое прогнозирование: выбор ядра, настройка параметров

В работе описывается метод ядерного сглаживания временного ряда, как один из видов непараметрической регрессии. Суть метода состоит в восстановлении функции времени, как взвешенной линейной комбинации точек из некоторой окрестности. Непрерывную ограниченную симметричную вещественную весовую функцию называют ядром. Полученная ядерная оценка используется для прогнозирования следующей точки ряда. Исследуется зависимость качества прогнозирования от параметров ядра и наложенного шума.

Задача 2: Экспоненциальное сглаживание и прогноз (пример)

В работе исследуется применение алгоритма экспоненциального сглаживания к прогнозированию временных рядов. В основе алгоритма лежит учет предыдущих значений ряда с весами, убывающими по мере удаления от исследуемого участка временного ряда. Изучено поведение алгоритма на модельных данных в различных моделях весов. Проведен анализ работы алгоритма на реальных данных -– биржевых индексах.

Задача 3: Выявление периодической компоненты временных рядов при помощи автокорреляционной функции и разложения в ряд Фурье (пример)

В работе рассматривается метод разложения временного ряда в ряд Фурье (базовый алгоритм) и его применение для прогнозирования временных рядов. Также производится сравнение результатов, полученных с помощью базового алгоритма, с результатами, полученными с помощью автокорреляционной функции при выявлении периодики предложенных временных рядов. В вычислительном эксперименте приводятся результаты работы обоих алгоритмов на зашумлённых модельных синусах, а также на реальных рядах продаж товаров.

Задача 4: Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)

В работе описывается метод гусеницы и его применение для прогнозирования временных рядов. Алгоритм основан на выделении из изучаемого временного ряда его информативных компонент и последующего построения прогноза. Исследуется зависимость точности прогнозов от выбора длины гусеницы и числа ее компонент. В вычислительном эксперименте приводятся результаты работы алгоритма на периодических рядах с разным рисунком внутри периода, на рядах с нарушением периодичности, а так же на реальных рядах почасовой температуры.

Задача 5: Прогнозирование функциями дискретного аргумента (пример)

Работа посвящена задаче прогнозирования временных рядов, представляющих собой монофонические мелодии, посредством функций дискретного переменного. В алгоритме будут использованы автокорреляционная функция, выделение трендов, экспоненциальное сглаживание временного ряда.

Мелодия представляется пучком из двух временных рядов, тонового и длительного. На первом этапе происходит выявление периодики мелодии, определение размера такта, а также обособление одиночных либо повторяющихся кусков пучка, или предложений.

На втором этапе происходит признаковое описание предложений(наклон тренда, дисперсия, длина).

На третьем этапе происходит экспоненциальное сглаживание рядов, их продолжение, классификация продолжения и его восстановление.

Задача 7: Локальные методы прогнозирования,поиск метрики (пример)

Временной ряд делится на отдельные участки, каждому из которых сопоставляется точка в n-мерном пространстве признаков. Локальная модель рассчитывается в три последовательных этапа. Первый – находит k-ближайших соседей наблюдаемой точки. Второй – строит простую модель, используя только этих k соседей. Третий – используя даную модель, по наблюдаемой точке прогнозирует следующую. Многие исследователи, используют эвклидову метрику для измерения расстояний между точками. Данная работа призвана сравнить точность прогнозирования при использовании различных метрик. В частности, требуется исследовать оптимальный набор весов во взвешенной метрике для максимизации точности прогнозирования.

Задача 8: Локальные методы прогнозирования, поиск инвариантного преобразования (пример)

В проекте используются локальные методы прогнозирования временных рядов. В этих методах не нахождится представления временного ряда в классе заданных функций от времени. Вместо этого прогноз осуществляется на основе данных о каком-то участке временного ряда (используется локальная информация). В данной работе подробно исследован следующий метод (обобщение классического «ближайшего соседа»).

Пусть имеется временной ряд, и стоит задача продолжить его. Предполагается, что такое продолжение определяется предысторией, т.е. в ряде нужно найти часть, которая после некоторого преобразования A становится схожа с той частью, которую мы стремимся прогнозировать. Поиск такого преобразования A и есть цель данного проекта. Для определения степени сходства используется функция B – функция близости двух отрезков временного ряда (подробнее об этом см. здесь). Так мы находим ближайшего соседа к нашей предыстории. В общем случае ищем несколько ближайших соседей. Продолжение запишется в виде их линейной комбинации.

Задача 9: Выравнивание временных рядов: прогнозирование с использованием DTW (пример)

Временным рядом называется последовательность упорядоченных по времени значений некоторой вещественной переменной $\mathbf{x}=\{x_{t}\}_{t=1}^T\in\mathbb{R}^T$. Задача, сопутствующая появлению временных рядов, - сравнение одной последовательности данных с другой. Сравнение последовательностей существенно упрощается после деформации временного ряда вдоль одной из осей и его выравнивания. Dynamic time warping (DTW) представляет собой технику эффективного выравнивая временных рядов. Методы DTW используются при распознавании речи, при анализе информации в робототехнике, в промышленности, в медицине и других сферах.

Цель работы - привести пример выравнивания, ввести функционал сравнения двух временных рядов, обладающий естественными свойствами коммутативности, рефлексивности и транзитивностина. Функционал должен принимать на вход два временных ряда, а на выходе давать число, характеризующее степень их "похожести".

Задача 10: Выбор функции активации при прогнозировании нейронными сетями (пример)

Целью проекта является исследование зависимости качества прогнозирования нейронными сетями без обратной связи (одно- и многослойными перцептронами) от выбранной функции активации нейронов в сети, а также от параметров этой функции, при наличии таковых.

Функция активации определяет сигнал на выходе нейрона в зависимости от результата работы сумматора на входе нейрона. Как правило, функция активации имеет область определения (-\infty; \infty) и область значений [0; 1]. В простейшем случае, изначально предложенном и моделирующим биологический нейрон, функция активации представляет собой функцию Хевисайда:

f(x) = \begin{cases}1 & x \geq x_0\\0 & x < x_0\end{cases}

При дальнейшем развитии нейронных сетей оказалось полезным использование непрерывных функций, таких как логистическая функция \sigma(x) = \frac{1}{1+e^{-tx}} и другие функции-сигмоиды (f(x) = \frac{x}{x+\alpha}) и немонотонные функции, такие как тригонометрический синус.

Результатом проекта является оценка качества прогнозирования нейронными сетями в зависимости от типа и параметров функции активации.

Задача 12: Исследование сходимости при прогнозировании нейронными сетями с обратной связью (пример)

Исследуется зависимость сходимости прогнозирования от параметров нейронной сети с обратной связью. Понятие обратной связи характерно для динамических систем, в которых выходной сигнал некоторого элемента cистемы оказывает влияние на входной сигнал этого элемента.Выходной сигнал можно представить в виде бесконечной взвешенной суммы текущего и предыдущих входных сигналов. В качестве модели нейрнонной сети используется модель Джордана. Предлагается исследовать скорость сходимости в зависимости от выбора функции активации (линейной, сигмоидной, гиперболического тангенса), от числа нейронов в промежуточном слое и от ширины скользящего окна.

Задача 13: Многомерная гусеница, выбор временных рядов при прогнозировании(пример)

Работа посвящена исследованию одного из методов анализа многомерных временных рядов - метода "гусеницы", также известного как Singular Spectrum Analysis или SSA. Метод можно разделить на четыре этапа - представление временного ряда в виде матрицы при помощи сдвиговой процедуры, вычисление ковариационной матрицы выборки и сингулярное ее разложение, отбор главных компонент,относящихся к различным составляющим ряда (от медленно меняющихся и периодических до шумовых), и, наконец, восстановление ряда.

Областью применения алгоритма являются задачи как метеорологии и геофизики, так и экономики и медицины. Целью данной работы является выяснение зависимости эффективности алгоритма от выбора временных рядов, используемых в его работе.

Задача 14: Прогнозирование с использованием теста Гренжера (пример)

При прогнозировании ряда бывает полезно определить, является ли данный ряд "зависимым" от некоторого другого ряда. Выявить подобную связь помогает тест Грейнджера, основанный на статистических тестах(при этом метод не гарантирует точного результата - при сравнении двух рядов, зависящих от еще одного ряда возможна ошибка). Метод применяется при прогнозировании экономических явлений и явлений природного характера (например, землятрясений).

Цель работы - предложить алгоритм, наилучшим образом использующий данный метод; исследовать эффективность метода в зависимости от прогнозируемых рядов.

Задача 15: Прогнозирование и аппроксимация сплайнами (пример)

Описание.

Задача 16: ARIMA и GARCH при прогнозировании высоковолатильных рядов (пример)

Описание.

Задача 17: Прогнозирование и SVN–регрессия (пример)

Описание.

Доклады и экзамен (возможны уточнения)

  • Доклад-1 6 апреля
  • Контрольная точка 11 мая
  • Экзамен 17 мая

Список задач, черновик

  1. Непараметрическое прогнозирование (выбор ядра из набора, настройка параметров)
  2. Прогнозирование и экспоненциальное сглаживание (набор временных рядов, исследование современного состояния)
  3. Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж)
  4. Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда)
  5. Многомерная гусеница, выбор временных рядов при прогнозировании
  6. Многомерная авторегрессия
  7. Локальные методы прогнозирования, поиск метрики
  8. Локальные методы прогнозирования, поиск инвариантного преобразования
  9. Прогнозирование с использованием пути наименьшей стоимости (DTW)
  10. Выбор функции активации при прогнозировании нейронными сетями
  11. Выбор ядра при прогнозировании функциями радиального базиса
  12. Исследование сходимости при прогнозировании нейронными сетями с обратной связью
  13. Прогнозирование функциями дискретного аргумента
  14. Прогнозирование с использованием теста Гренжера
  15. Прогнозирование и SVN – регрессия
  16. ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)
  17. Прогнозирование и аппроксимация сплайнами
  18. Изображение:JokeExam486in2011Spring.png|150px|right|frame|Экзамен-шутка: результаты
Личные инструменты