Авторегрессионное скользящее среднее

Материал из MachineLearning.

(Перенаправлено с Модель Бокса-Дженкинса)

В статистике и обработке сигналов модель авторегрессионного скользящего среднего (autoregressive moving average, ARMA), называемая иногда моделью Бокса-Дженкинса, применяется для исследования временных рядов.

Имея временной ряд $X_t$ , модель авторегрессионного скользящего среднего позволяет объяснить и, возможно, предсказать будущие значения ряда. Модель состоит из двух частей: авторегрессионной (AR) части и скользящего среднего(MA). Для упоминания модели обычно используется обозначение ARMA(p,q), где p — порядок регрессионной части, а q — порядок скользящего среднего.

Содержание

1 Авторегрессионная модель
2 Скользящее среднее
3 Авторегрессионное скользящее среднее
4 Погрешности
5 Определение с помощью оператора задержки
- 5.1 Альтернативные обозначения
6 Модели настройки

Авторегрессионная модель

Сочетание AR(p) используется для обозначения авторегрессионной модели порядка p. AR(p) записывается следующим образом:

$X_t = c + \sum_{i=1}^p \varphi_i X_{t-i} + \epsilon_t$ ,

где $\varphi_1,\dots,\varphi_p$ — параметры модели, $c$ — константа, а $\epsilon_t$ — белый шум. Для простоты константу зачастую опускают. По сути своей авторегрессионная модель является полюсным фильтром с бесконечной импульсной характеристикой, истолкованным в контексте анализа временных рядов. Для того, чтобы модель была стационарной требуется наложить некоторые ограничения на параметры модели. Например, при $|\varphi_1| \ge 1$ модель AR(1) не будет обладать свойством стационарности.

Скользящее среднее

Модель скользящего среднего порядка q обозначается MA(q) и записывается следующим образом:

$X_t = \sum_{i=1}^q \theta_i \epsilon_{t-i} + \epsilon_t$ ,

где $\theta_1,\dots,\theta_q$ — параметры модели, а $\epsilon_t, \dots, \epsilon_{t-q}$ — ошибки. Скользящее среднее можно рассматривать, как интерпретацию фильтра с конечной импульсной характеристикой

Авторегрессионное скользящее среднее

Под обозначением ARMA(p,q) понимается модель, содержащая p авторегрессионных составляющих и q скользящих средних. Точнее модель ARMA(p,q) включает в себя модели AR(p) и MA(q):

$X_t = c + \epsilon_t + \sum_{i=1}^q \theta_i \epsilon_{t-i} + \sum_{i=1}^p \varphi_i X_{t-i}$ ,

Погрешности

Обычно значения ошибки $\epsilon_t$ полагают независимыми одинаково распределёнными случайными величинами, взятыми из нормального распределения с нулевым средним: $\epsilon_t \sim N \left(0, \sigma^2 \right)$ , где $\sigma^2$ — дисперсия. Предположения можно ослабить, но это может привести к изменению свойств модели. Например, если не предполагать независимости и одинакового распределения ошибок, поведение модели существенным образом меняется.

Определение с помощью оператора задержки

Возможно и другое определение модели ARMA — с помощью оператора задержки L. В этом случае авторегрессионная модель AR{p) задаётся формулой
$\epsilon_t = \left(1 - \sum_{i=1}^p \varphi_i L_i \right) X_t = \varphi X_t$
, где $\varphi$ — полином
$\varphi = 1 - \sum_{i=1}^p \varphi_i L^i$ .
Модель MA(q) задаётся следующим образом:
$X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t = \theta \epsilon_t$
, где $\theta$ — полином
$\theta = 1 - \sum_{i=1}^p \theta_i L^i$ .
Наконец, модель ARMA(p,q) описывается формулой
$\left(1 - \sum_{i=1}^p \varphi_i L_i \right) X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t$ ,
или коротко
$\varphi X_t = \theta \epsilon_t$ .

Альтернативные обозначения

Некоторые авторы, такие как, например, Бокс, Дженкинс и Рейнсел (1994) вычисляют авторегрессионные коэффициенты по иным правилам. Это позволяет записать полиномы, зависящим от оператора задержки, в схожем виде. В этих обозначениях модель ARMA(p,q) записывается, как
$\left(1 + \sum_{i=1}^p \phi_i L_i \right) X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t.$

Модели настройки

После выбора параметров p и q может с помощью метода наименьших квадратов чтобы минимизировать погрешность. Обычно находят наименьшие p и q, при которых модель описывает данные с удовлетворительной точностью. Для настройки "чистой" авторегрессионной модели можно использовать систему уравнений Юла-Уолкера.