Авторегрессионное скользящее среднее

Материал из MachineLearning.

Перейти к: навигация, поиск

В статистике и обработке сигналов модель авторегрессионного скользящего среднего (autoregressive moving average, ARMA), называемая иногда моделью Бокса-Дженкинса, применяется для исследования временных рядов.

Имея временной ряд X_t, модель авторегрессионного скользящего среднего позволяет объяснить и, возможно, предсказать будущие значения ряда. Модель состоит из двух частей: авторегрессионной (AR) части и скользящего среднего(MA). Для упоминания модели обычно используется обозначение ARMA(p,q), где p — порядок регрессионной части, а q — порядок скользящего среднего.

Содержание

Авторегрессионная модель

Сочетание AR(p) используется для обозначения авторегрессионной модели порядка p. AR(p) записывается следующим образом:

X_t = c + \sum_{i=1}^p \varphi_i X_{t-i} + \epsilon_t,

где \varphi_1,\dots,\varphi_p — параметры модели, c — константа, а \epsilon_tбелый шум. Для простоты константу зачастую опускают. По сути своей авторегрессионная модель является полюсным фильтром с бесконечной импульсной характеристикой, истолкованным в контексте анализа временных рядов. Для того, чтобы модель была стационарной требуется наложить некоторые ограничения на параметры модели. Например, при |\varphi_1| \ge 1 модель AR(1) не будет обладать свойством стационарности.

Скользящее среднее

Модель скользящего среднего порядка q обозначается MA(q) и записывается следующим образом:

X_t = \sum_{i=1}^q \theta_i \epsilon_{t-i} + \epsilon_t,

где \theta_1,\dots,\theta_q — параметры модели, а \epsilon_t, \dots, \epsilon_{t-q} — ошибки. Скользящее среднее можно рассматривать, как интерпретацию фильтра с конечной импульсной характеристикой

Авторегрессионное скользящее среднее

Под обозначением ARMA(p,q) понимается модель, содержащая p авторегрессионных составляющих и q скользящих средних. Точнее модель ARMA(p,q) включает в себя модели AR(p) и MA(q):

X_t = c + \epsilon_t + \sum_{i=1}^q \theta_i \epsilon_{t-i} + \sum_{i=1}^p \varphi_i X_{t-i},

Погрешности

Обычно значения ошибки \epsilon_t полагают независимыми одинаково распределёнными случайными величинами, взятыми из нормального распределения с нулевым средним: \epsilon_t \sim N \left(0, \sigma^2 \right), где \sigma^2 — дисперсия. Предположения можно ослабить, но это может привести к изменнеию свойтв модели. Например, если не предполагать независимости и одинакового распределения ошибок, поведение модели существенным образом меняется.

Определение с помощью оператора задержки

Возможно и другое определение модели ARMA — с помощью оператора задержки L. В этом случае авторегрессионная модель AR{p) задаётся формулой
\epsilon_t = \left(1 - \sum_{i=1}^p \varphi_i L_i \right) X_t = \varphi X_t
, где \varphi — полином
\varphi = 1 - \sum_{i=1}^p \varphi_i L^i.
Модель MA(q) задаётся следующим образом:
X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t = \theta \epsilon_t
, где \theta — полином
\theta = 1 - \sum_{i=1}^p \theta_i L^i.
Наконец, модель ARMA(p,q) описывается формулой
\left(1 - \sum_{i=1}^p \varphi_i L_i \right) X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t,
или коротко
\varphi X_t = \theta \epsilon_t.

Альтернативные обозначения

Некоторые авторы, такие как, например, Бокс, Дженкинс и Рейнсел (1994) вычисляют авторегрессионные коэффициенты по иным правилам. Это позволяет записать полиномы, зависящим от оператора задержки, в схожем виде. В этих обозначениях модель ARMA(p,q) записывается, как
\left(1 + \sum_{i=1}^p \phi_i L_i \right) X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t.

Модели настройки

После выбора параметров p и q может с помощью метода наименьших квадратов чтобы минимизировать погрешность. Обычно находят наименьшие p и q, при которых модель описывает данные с удовлетворительной точностью. Для настройки "чистой" авторегрессионной модели можно использовать систему уравнений Юла-Уолкера.


Статья в настоящий момент дорабатывается.
Nick D. 14:46, 21 января 2009 (MSK)


Личные инструменты