ARIMA
Материал из MachineLearning.
Дорофеев Н.Ю. (Обсуждение | вклад)
(Новая: '''Авторегрессионное интегрированное скользящее среднее''' (autoregressive integrated moving average, ARIMA) является обобщ...)
К следующему изменению →
Версия 15:17, 8 декабря 2008
Авторегрессионное интегрированное скользящее среднее (autoregressive integrated moving average, ARIMA) является обобщением модели авторегрессионного скользящего среднего. Эти модели используются при работе с временными рядами для более глубокого понимания данных или предсказания будущих точек ряда. Обычно модель упоминается, как ARIMA(p,d,q), где p,d и q — целые неотрицательные числа, характеризующие порядок для частей модели (соответственно авторегрессионной, интегрированной и скользящего среднего).
Пусть задан временной ряд , где t — целый индекс и — вещественные числа.
Тогда модель ARMA(p,q) задаётся следующем образом:
- ,
- ,
где L — оператор задержки, — параметры авторегрессионной части модели, — параметры скользящего среднего, а — значения ошибки. Обычно предполагают, что ошибки являются независимыми одинаково распределёнными случайными величинами из нормального распределения с нулевым средним.
ARIMA(p,d,q) получается интегрированием ARMA(p,q).
- ,
- ,
где d — положительное целое, задающее уровень дифференцирования (если d=0, эта модель эквивалентна авторегрессионному скользящему среднему). И наоборот, применяя почленное дифференцирование d раз к модели ARMA(p,q), получим модель ARIMA(p,d,q). Заметим, что дифференцировать надо только авторегрессионную часть.
Важно отметить, что не все сочетания параметров дают «хорошую» модель. В частности, чтобы получить стационарную модель требуется выполнение некоторых условий.
Существует несколько известных частных случаев модели ARIMA.
Например, ARIMA(0,1,0), задающая
- ,
- ,
является моделью случайных блужданий.
Используется большое количество вариаций модели ARIMA. Например, если исследуются несколько рядов, то можно трактовать как векторы. Тогда мы приходим к модели VARIMA. Иногда в модели может иметься сезонный фактор. Примером может послужить модель объёма трафика за день. На выходных поведение ряда будет заметно отличаться от рабочих дней. В этом случае вместо того, чтобы наращивать порядки скользящего среднего и авторегрессионной части модели, лучше прибегнуть к модели сезонного авторегрессионного скользящего среднего (SARIMA). Если имеется некоторая долгосрочная зависимость, параметр d может быть заменён нецелыми значениями, приводя к авторегрессионному дробноинтегрированному процессу скользящего среднего (FARIMA или ARFIMA).