Авторегрессионное скользящее среднее
Материал из MachineLearning.
м (→Авторегрессионная модель) |
(→Опечатки) |
||
(3 промежуточные версии не показаны) | |||
Строка 9: | Строка 9: | ||
Сочетание AR(<i>p</i>) используется для обозначения [[авторегрессионная модель|авторегрессионной модели]] порядка <i>p</i>. | Сочетание AR(<i>p</i>) используется для обозначения [[авторегрессионная модель|авторегрессионной модели]] порядка <i>p</i>. | ||
AR(<i>p</i>) записывается следующим образом: <br /> | AR(<i>p</i>) записывается следующим образом: <br /> | ||
- | ::<tex>X_t = c + \sum_{i=1}^p \ | + | ::<tex>X_t = c + \sum_{i=1}^p \varphi_i X_{t-i} + \epsilon_t</tex>, <br /> |
- | где <tex>\ | + | где <tex>\varphi_1,\dots,\varphi_p</tex> — параметры модели, <tex>c</tex> — константа, а <tex>\epsilon_t</tex> — [[белый шум]]. |
Для простоты константу зачастую опускают. | Для простоты константу зачастую опускают. | ||
По сути своей авторегрессионная модель является [[полюсный фильтр|полюсным]] [[фильтр с бесконечной импульсной характеристикой|фильтром с бесконечной импульсной характеристикой]], истолкованным в контексте анализа временных рядов. | По сути своей авторегрессионная модель является [[полюсный фильтр|полюсным]] [[фильтр с бесконечной импульсной характеристикой|фильтром с бесконечной импульсной характеристикой]], истолкованным в контексте анализа временных рядов. | ||
Для того, чтобы модель была стационарной требуется наложить некоторые ограничения на параметры модели. | Для того, чтобы модель была стационарной требуется наложить некоторые ограничения на параметры модели. | ||
- | Например, при <tex>|\ | + | Например, при <tex>|\varphi_1| \ge 1</tex> модель AR(1) не будет обладать свойством стационарности. |
==Скользящее среднее== | ==Скользящее среднее== | ||
Строка 26: | Строка 26: | ||
Под обозначением ARMA(<i>p,q</i>) понимается модель, содержащая <i>p</i> авторегрессионных составляющих и <i>q</i> скользящих средних. Точнее модель ARMA(<i>p,q</i>) включает в себя модели AR(<i>p</i>) и MA(<i>q</i>):<br /> | Под обозначением ARMA(<i>p,q</i>) понимается модель, содержащая <i>p</i> авторегрессионных составляющих и <i>q</i> скользящих средних. Точнее модель ARMA(<i>p,q</i>) включает в себя модели AR(<i>p</i>) и MA(<i>q</i>):<br /> | ||
- | ::<tex>X_t = c + \epsilon_t + \sum_{i=1}^q \theta_i \epsilon_{t-i} + \sum_{i=1}^p \ | + | ::<tex>X_t = c + \epsilon_t + \sum_{i=1}^q \theta_i \epsilon_{t-i} + \sum_{i=1}^p \varphi_i X_{t-i}</tex>, <br /> |
==Погрешности== | ==Погрешности== | ||
- | Обычно значения ошибки <tex>\epsilon_t</tex> полагают независимыми одинаково распределёнными случайными величинами, взятыми из нормального распределения с нулевым средним: <tex>\epsilon_t \sim N \left(0, \sigma^2 \right)</tex>, где <tex>\sigma^2</tex> — дисперсия. Предположения можно ослабить, но это может привести к | + | Обычно значения ошибки <tex>\epsilon_t</tex> полагают независимыми одинаково распределёнными случайными величинами, взятыми из нормального распределения с нулевым средним: <tex>\epsilon_t \sim N \left(0, \sigma^2 \right)</tex>, где <tex>\sigma^2</tex> — дисперсия. Предположения можно ослабить, но это может привести к изменению свойств модели. Например, если не предполагать независимости и одинакового распределения ошибок, поведение модели существенным образом меняется. |
- | {{UnderConstruction|[[Участник:Дорофеев Н.Ю.| | + | ==Определение с помощью оператора задержки== |
+ | |||
+ | Возможно и другое определение модели ARMA — с помощью [[оператор задержки|оператора задержки]] <i>L</i>. | ||
+ | В этом случае авторегрессионная модель AR{<i>p</i>) задаётся формулой <br /> | ||
+ | <tex>\epsilon_t = \left(1 - \sum_{i=1}^p \varphi_i L_i \right) X_t = \varphi X_t</tex> <br />, | ||
+ | где <tex>\varphi</tex> — полином <br /> | ||
+ | <tex>\varphi = 1 - \sum_{i=1}^p \varphi_i L^i</tex>. <br /> | ||
+ | Модель MA(<i>q</i>) задаётся следующим образом: <br /> | ||
+ | <tex>X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t = \theta \epsilon_t</tex> <br />, | ||
+ | где <tex>\theta</tex> — полином <br /> | ||
+ | <tex>\theta = 1 - \sum_{i=1}^p \theta_i L^i</tex>. <br /> | ||
+ | Наконец, модель ARMA(<i>p,q</i>) описывается формулой <br /> | ||
+ | <tex>\left(1 - \sum_{i=1}^p \varphi_i L_i \right) X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t</tex>, <br /> | ||
+ | или коротко <br /> | ||
+ | <tex>\varphi X_t = \theta \epsilon_t</tex>. | ||
+ | |||
+ | ===Альтернативные обозначения=== | ||
+ | |||
+ | Некоторые авторы, такие как, например, Бокс, Дженкинс и Рейнсел (1994) вычисляют авторегрессионные коэффициенты по иным правилам. | ||
+ | Это позволяет записать полиномы, зависящим от оператора задержки, в схожем виде. | ||
+ | В этих обозначениях модель ARMA(<i>p,q</i>) записывается, как <br /> | ||
+ | <tex>\left(1 + \sum_{i=1}^p \phi_i L_i \right) X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t.</tex> | ||
+ | |||
+ | ==Модели настройки== | ||
+ | |||
+ | После выбора параметров <i>p</i> и <i>q</i> может с помощью [[метод наименьших квадратов|метода наименьших квадратов]] чтобы минимизировать погрешность. | ||
+ | Обычно находят наименьшие <i>p</i> и <i>q</i>, при которых модель описывает данные с удовлетворительной точностью. | ||
+ | Для настройки "чистой" авторегрессионной модели можно использовать систему уравнений Юла-Уолкера. | ||
+ | |||
+ | {{UnderConstruction|[[Участник:Дорофеев Н.Ю.|Nick D.]] 14:46, 21 января 2009 (MSK)}} | ||
+ | |||
+ | [[Категория:Прогнозирование временных рядов]] |
Текущая версия
В статистике и обработке сигналов модель авторегрессионного скользящего среднего (autoregressive moving average, ARMA), называемая иногда моделью Бокса-Дженкинса, применяется для исследования временных рядов.
Имея временной ряд , модель авторегрессионного скользящего среднего позволяет объяснить и, возможно, предсказать будущие значения ряда. Модель состоит из двух частей: авторегрессионной (AR) части и скользящего среднего(MA). Для упоминания модели обычно используется обозначение ARMA(p,q), где p — порядок регрессионной части, а q — порядок скользящего среднего.
Содержание |
Авторегрессионная модель
Сочетание AR(p) используется для обозначения авторегрессионной модели порядка p.
AR(p) записывается следующим образом:
- ,
- ,
где — параметры модели, — константа, а — белый шум. Для простоты константу зачастую опускают. По сути своей авторегрессионная модель является полюсным фильтром с бесконечной импульсной характеристикой, истолкованным в контексте анализа временных рядов. Для того, чтобы модель была стационарной требуется наложить некоторые ограничения на параметры модели. Например, при модель AR(1) не будет обладать свойством стационарности.
Скользящее среднее
Модель скользящего среднего порядка q обозначается MA(q) и записывается следующим образом:
- ,
- ,
где — параметры модели, а — ошибки. Скользящее среднее можно рассматривать, как интерпретацию фильтра с конечной импульсной характеристикой
Авторегрессионное скользящее среднее
Под обозначением ARMA(p,q) понимается модель, содержащая p авторегрессионных составляющих и q скользящих средних. Точнее модель ARMA(p,q) включает в себя модели AR(p) и MA(q):
- ,
- ,
Погрешности
Обычно значения ошибки полагают независимыми одинаково распределёнными случайными величинами, взятыми из нормального распределения с нулевым средним: , где — дисперсия. Предположения можно ослабить, но это может привести к изменению свойств модели. Например, если не предполагать независимости и одинакового распределения ошибок, поведение модели существенным образом меняется.
Определение с помощью оператора задержки
Возможно и другое определение модели ARMA — с помощью оператора задержки L.
В этом случае авторегрессионная модель AR{p) задаётся формулой
,
где — полином
.
Модель MA(q) задаётся следующим образом:
,
где — полином
.
Наконец, модель ARMA(p,q) описывается формулой
,
или коротко
.
Альтернативные обозначения
Некоторые авторы, такие как, например, Бокс, Дженкинс и Рейнсел (1994) вычисляют авторегрессионные коэффициенты по иным правилам.
Это позволяет записать полиномы, зависящим от оператора задержки, в схожем виде.
В этих обозначениях модель ARMA(p,q) записывается, как
Модели настройки
После выбора параметров p и q может с помощью метода наименьших квадратов чтобы минимизировать погрешность. Обычно находят наименьшие p и q, при которых модель описывает данные с удовлетворительной точностью. Для настройки "чистой" авторегрессионной модели можно использовать систему уравнений Юла-Уолкера.
Статья в настоящий момент дорабатывается. Nick D. 14:46, 21 января 2009 (MSK) |