Сравнение временных рядов при авторегрессионном прогнозе (пример)
Материал из MachineLearning.
(→Литература) |
(→Вычислительный эксперимент) |
||
Строка 42: | Строка 42: | ||
== Вычислительный эксперимент == | == Вычислительный эксперимент == | ||
+ | Вычислительный эксперимент проводился на реальных данных. Использовались временные ряды потребления электроэнергии в некотором регионе с отсчетами а) 1 час и b) 24 часа. В первом случае период ряда был равен <tex>p=24</tex>, во втором <tex>p=7</tex>. Для решения задача линейной регрессии использовался метод наименьших углов (ЛАРС). | ||
+ | |||
== Исходный код == | == Исходный код == | ||
== Смотри также == | == Смотри также == |
Версия 07:56, 9 декабря 2010
Содержание |
Аннотация
Временным рядом называется последовательность упорядоченных по времени значений некоторой вещественной переменной . Элемент последовательности называется отсчетом временного ряда.
Задача авторегрессионного прогноза заключается в нахождении модели , где вектор параметров модели, которая наилучшим образом приближает следущее значение временного ряда . Свертка временного ряда возникает в случае существования на множестве подпоследовательностей временного ряда некоторого инварианта. Примером инварианта является период временного ряда, который физически может означать сезонность в данных. При этом построенная модель должна учитывать наличие инварианта и сохранять данное свойство для ряда прогнозов: .
Постановка задачи
Пусть задан временной ряд . Предполагается, что отсчеты были сделаны через равные промежутки времени, и период временного ряда равен , при этом , где . Требуется спрогнозировать следующий отсчет временного ряда .
Построим матрицу .
Модель имеет вид , где , а набор порождающих функций.
Алгоритм
В терминах поставленной задачи следует решить следующую задачу оптимизации: , где Если зафиксировать набор порождающих функций , то возникает задача линейной регрессии, которую можно решать несколькими способами. Так как за счет большого количества порождающих функций у нас появится огромное количество признаков то наиболее подходящими будут методы, проводящие отбор признаков: гребневая регрессия, лассо, шаговая регрессия, метод наименьших углов(ЛАРС).
Вычислительный эксперимент
Вычислительный эксперимент проводился на реальных данных. Использовались временные ряды потребления электроэнергии в некотором регионе с отсчетами а) 1 час и b) 24 часа. В первом случае период ряда был равен , во втором . Для решения задача линейной регрессии использовался метод наименьших углов (ЛАРС).
Исходный код
Смотри также
Литература
- Стрижов В.В, Пташко Г.О. Построение инвариантов на множестве временных рядов путем динамической свертки свободной переменной. — ВЦ РАН, 2009.
- Стрижов В.В Методы выбора регрессионных моделей. — ВЦ РАН, 2010.