Авторегрессионное скользящее среднее

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Авторегрессионная модель)
(дополнение)
Строка 9: Строка 9:
Сочетание AR(<i>p</i>) используется для обозначения [[авторегрессионная модель|авторегрессионной модели]] порядка <i>p</i>.
Сочетание AR(<i>p</i>) используется для обозначения [[авторегрессионная модель|авторегрессионной модели]] порядка <i>p</i>.
AR(<i>p</i>) записывается следующим образом: <br />
AR(<i>p</i>) записывается следующим образом: <br />
-
::<tex>X_t = c + \sum_{i=1}^p \phi_i X_{t-i} + \epsilon_t</tex>, <br />
+
::<tex>X_t = c + \sum_{i=1}^p \varphi_i X_{t-i} + \epsilon_t</tex>, <br />
-
где <tex>\phi_1,\dots,\phi_p</tex> — параметры модели, <tex>c</tex> — константа, а <tex>\epsilon_t</tex> — [[белый шум]].
+
где <tex>\varphi_1,\dots,\varphi_p</tex> — параметры модели, <tex>c</tex> — константа, а <tex>\epsilon_t</tex> — [[белый шум]].
Для простоты константу зачастую опускают.
Для простоты константу зачастую опускают.
По сути своей авторегрессионная модель является [[полюсный фильтр|полюсным]] [[фильтр с бесконечной импульсной характеристикой|фильтром с бесконечной импульсной характеристикой]], истолкованным в контексте анализа временных рядов.
По сути своей авторегрессионная модель является [[полюсный фильтр|полюсным]] [[фильтр с бесконечной импульсной характеристикой|фильтром с бесконечной импульсной характеристикой]], истолкованным в контексте анализа временных рядов.
Для того, чтобы модель была стационарной требуется наложить некоторые ограничения на параметры модели.
Для того, чтобы модель была стационарной требуется наложить некоторые ограничения на параметры модели.
-
Например, при <tex>|\phi_1| \ge 1</tex> модель AR(1) не будет обладать свойством стационарности.
+
Например, при <tex>|\varphi_1| \ge 1</tex> модель AR(1) не будет обладать свойством стационарности.
==Скользящее среднее==
==Скользящее среднее==
Строка 26: Строка 26:
Под обозначением ARMA(<i>p,q</i>) понимается модель, содержащая <i>p</i> авторегрессионных составляющих и <i>q</i> скользящих средних. Точнее модель ARMA(<i>p,q</i>) включает в себя модели AR(<i>p</i>) и MA(<i>q</i>):<br />
Под обозначением ARMA(<i>p,q</i>) понимается модель, содержащая <i>p</i> авторегрессионных составляющих и <i>q</i> скользящих средних. Точнее модель ARMA(<i>p,q</i>) включает в себя модели AR(<i>p</i>) и MA(<i>q</i>):<br />
-
::<tex>X_t = c + \epsilon_t + \sum_{i=1}^q \theta_i \epsilon_{t-i} + \sum_{i=1}^p \phi_i X_{t-i}</tex>, <br />
+
::<tex>X_t = c + \epsilon_t + \sum_{i=1}^q \theta_i \epsilon_{t-i} + \sum_{i=1}^p \varphi_i X_{t-i}</tex>, <br />
==Погрешности==
==Погрешности==
Строка 32: Строка 32:
Обычно значения ошибки <tex>\epsilon_t</tex> полагают независимыми одинаково распределёнными случайными величинами, взятыми из нормального распределения с нулевым средним: <tex>\epsilon_t \sim N \left(0, \sigma^2 \right)</tex>, где <tex>\sigma^2</tex> — дисперсия. Предположения можно ослабить, но это может привести к изменнеию свойтв модели. Например, если не предполагать независимости и одинакового распределения ошибок, поведение модели существенным образом меняется.
Обычно значения ошибки <tex>\epsilon_t</tex> полагают независимыми одинаково распределёнными случайными величинами, взятыми из нормального распределения с нулевым средним: <tex>\epsilon_t \sim N \left(0, \sigma^2 \right)</tex>, где <tex>\sigma^2</tex> — дисперсия. Предположения можно ослабить, но это может привести к изменнеию свойтв модели. Например, если не предполагать независимости и одинакового распределения ошибок, поведение модели существенным образом меняется.
-
{{UnderConstruction|[[Участник:Дорофеев Н.Ю.|Дорофеев Н.Ю.]] 12:14, 10 декабря 2008 (MSK)}}
+
==Определение с помощью оператора задержки==
 +
 
 +
Возможно и другое определение модели ARMA — с помощью [[оператор задержки|оператора задержки]] <i>L</i>.
 +
В этом случае авторегрессионная модель AR{<i>p</i>) задаётся формулой <br />
 +
<tex>\epsilon_t = \left(1 - \sum_{i=1}^p \varphi_i L_i \right) X_t = \varphi X_t</tex> <br />,
 +
где <tex>\varphi</tex> — полином <br />
 +
<tex>\varphi = 1 - \sum_{i=1}^p \varphi_i L^i</tex>. <br />
 +
Модель MA(<i>q</i>) задаётся следующим образом: <br />
 +
<tex>X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t = \theta \epsilon_t</tex> <br />,
 +
где <tex>\theta</tex> — полином <br />
 +
<tex>\theta = 1 - \sum_{i=1}^p \theta_i L^i</tex>. <br />
 +
Наконец, модель ARMA(<i>p,q</i>) описывается формулой <br />
 +
<tex>\left(1 - \sum_{i=1}^p \varphi_i L_i \right) X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t</tex>, <br />
 +
или коротко <br />
 +
<tex>\varphi X_t = \theta \epsilon_t</tex>.
 +
 
 +
===Альтернативные обозначения===
 +
 
 +
Некоторые авторы, такие как, например, Бокс, Дженкинс и Рейнсел (1994) вычисляют авторегрессионные коэффициенты по иным правилам.
 +
Это позволяет записать полиномы, зависящим от оператора задержки, в схожем виде.
 +
В этих обозначениях модель ARMA(<i>p,q</i>) записывается, как <br />
 +
<tex>\left(1 + \sum_{i=1}^p \phi_i L_i \right) X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t.</tex>
 +
 
 +
==Модели настройки==
 +
 
 +
После выбора параметров <i>p</i> и <i>q</i> может с помощью [[метод наименьших квадратов|метода наименьших квадратов]] чтобы минимизировать погрешность.
 +
Обычно находят наименьшие <i>p</i> и <i>q</i>, при которых модель описывает данные с удовлетворительной точностью.
 +
Для настройки "чистой" авторегрессионной модели можно использовать систему уравнений Юла-Уолкера.
 +
 
 +
{{UnderConstruction|[[Участник:Дорофеев Н.Ю.|Nick D.]] 14:46, 21 января 2009 (MSK)}}

Версия 11:46, 21 января 2009

В статистике и обработке сигналов модель авторегрессионного скользящего среднего (autoregressive moving average, ARMA), называемая иногда моделью Бокса-Дженкинса, применяется для исследования временных рядов.

Имея временной ряд X_t, модель авторегрессионного скользящего среднего позволяет объяснить и, возможно, предсказать будущие значения ряда. Модель состоит из двух частей: авторегрессионной (AR) части и скользящего среднего(MA). Для упоминания модели обычно используется обозначение ARMA(p,q), где p — порядок регрессионной части, а q — порядок скользящего среднего.

Содержание

Авторегрессионная модель

Сочетание AR(p) используется для обозначения авторегрессионной модели порядка p. AR(p) записывается следующим образом:

X_t = c + \sum_{i=1}^p \varphi_i X_{t-i} + \epsilon_t,

где \varphi_1,\dots,\varphi_p — параметры модели, c — константа, а \epsilon_tбелый шум. Для простоты константу зачастую опускают. По сути своей авторегрессионная модель является полюсным фильтром с бесконечной импульсной характеристикой, истолкованным в контексте анализа временных рядов. Для того, чтобы модель была стационарной требуется наложить некоторые ограничения на параметры модели. Например, при |\varphi_1| \ge 1 модель AR(1) не будет обладать свойством стационарности.

Скользящее среднее

Модель скользящего среднего порядка q обозначается MA(q) и записывается следующим образом:

X_t = \sum_{i=1}^q \theta_i \epsilon_{t-i} + \epsilon_t,

где \theta_1,\dots,\theta_q — параметры модели, а \epsilon_t, \dots, \epsilon_{t-q} — ошибки. Скользящее среднее можно рассматривать, как интерпретацию фильтра с конечной импульсной характеристикой

Авторегрессионное скользящее среднее

Под обозначением ARMA(p,q) понимается модель, содержащая p авторегрессионных составляющих и q скользящих средних. Точнее модель ARMA(p,q) включает в себя модели AR(p) и MA(q):

X_t = c + \epsilon_t + \sum_{i=1}^q \theta_i \epsilon_{t-i} + \sum_{i=1}^p \varphi_i X_{t-i},

Погрешности

Обычно значения ошибки \epsilon_t полагают независимыми одинаково распределёнными случайными величинами, взятыми из нормального распределения с нулевым средним: \epsilon_t \sim N \left(0, \sigma^2 \right), где \sigma^2 — дисперсия. Предположения можно ослабить, но это может привести к изменнеию свойтв модели. Например, если не предполагать независимости и одинакового распределения ошибок, поведение модели существенным образом меняется.

Определение с помощью оператора задержки

Возможно и другое определение модели ARMA — с помощью оператора задержки L. В этом случае авторегрессионная модель AR{p) задаётся формулой
\epsilon_t = \left(1 - \sum_{i=1}^p \varphi_i L_i \right) X_t = \varphi X_t
, где \varphi — полином
\varphi = 1 - \sum_{i=1}^p \varphi_i L^i.
Модель MA(q) задаётся следующим образом:
X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t = \theta \epsilon_t
, где \theta — полином
\theta = 1 - \sum_{i=1}^p \theta_i L^i.
Наконец, модель ARMA(p,q) описывается формулой
\left(1 - \sum_{i=1}^p \varphi_i L_i \right) X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t,
или коротко
\varphi X_t = \theta \epsilon_t.

Альтернативные обозначения

Некоторые авторы, такие как, например, Бокс, Дженкинс и Рейнсел (1994) вычисляют авторегрессионные коэффициенты по иным правилам. Это позволяет записать полиномы, зависящим от оператора задержки, в схожем виде. В этих обозначениях модель ARMA(p,q) записывается, как
\left(1 + \sum_{i=1}^p \phi_i L_i \right) X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t.

Модели настройки

После выбора параметров p и q может с помощью метода наименьших квадратов чтобы минимизировать погрешность. Обычно находят наименьшие p и q, при которых модель описывает данные с удовлетворительной точностью. Для настройки "чистой" авторегрессионной модели можно использовать систему уравнений Юла-Уолкера.


Статья в настоящий момент дорабатывается.
Nick D. 14:46, 21 января 2009 (MSK)


Личные инструменты