Экспоненциальное сглаживание

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: {{TOCright}} == Определение == Пусть задан временной ряд: <tex>y_i \dots y_t,\; y_i \in R</tex>. Необходимо решить задачу прог...)
(Ссылки)
 
(13 промежуточных версий не показаны.)
Строка 1: Строка 1:
{{TOCright}}
{{TOCright}}
-
== Определение ==
+
Выявление и анализ тенденции временного ряда часто производится с помощью его выравнивания или сглаживания. Экспоненциальное сглаживание — один из простейших и распространенных приемов выравнивания ряда. Экспоненциальное сглаживание можно представить как фильтр, на вход которого последовательно поступают члены исходного ряда, а на выходе формируются текущие значения экспоненциальной средней.
 +
 
 +
Пусть <tex>X=\{x_1, \dots x_T\}</tex> - временной ряд.
 +
 
 +
Экспоненциальное сглаживание ряда осуществляется по рекуррентной формуле:
 +
<tex>S_t=\alpha x_t + \left( 1-\alpha \right) S_{t-1},\;</tex>, <tex> \alpha \in (0,1)</tex>.
 +
 
 +
Чем меньше α, тем в большей степени фильтруются, подавляются колебания исходного ряда и шума.
 +
 
 +
Если последовательно использовать рекуррентное это соотношение, то экспоненциальную среднюю <tex>S_t</tex> можно выразить через значения временного ряда X.
 +
 
 +
<tex>S_t =\alpha x_t + (1-\alpha)\left( \alpha x_{t-1} + (1-\alpha)S_{t-2}\right)= \dots = \alpha \sum_{i=0}^{t-1} (1-\alpha)^i x_{t-i} + (1-\alpha)^t S_0</tex>.
 +
 
 +
Если к моменту начала сглаживания существуют более ранние данные, то в качестве начального
 +
значения <tex>S_0</tex> можно использовать арифметическую среднюю всех имеющихся данных или какой-то их части.
 +
 
 +
После появления работ Р. Брауна экспоненциальное сглаживание часто используется для решения задачи краткосрочного прогнозирования временных рядов.
 +
 
 +
== Постановка задачи ==
 +
 
Пусть задан временной ряд: <tex>y_i \dots y_t,\; y_i \in R</tex>.
Пусть задан временной ряд: <tex>y_i \dots y_t,\; y_i \in R</tex>.
Строка 14: Строка 33:
<tex>Q_T=\sum_{i=1}^T w_{T-i} \left( y_i-\hat{y}_i \right) \rightarrow min</tex>
<tex>Q_T=\sum_{i=1}^T w_{T-i} \left( y_i-\hat{y}_i \right) \rightarrow min</tex>
-
Предположим, что D - невелико (краткосрочный прогноз), то для решения такой задачи используют '''модель Брауна '''(экспоненциальное сглаживание).
+
== Модель Брауна==
 +
Предположим, что D - невелико (краткосрочный прогноз), то для решения такой задачи используют '''модель Брауна '''.
-
<tex>\hat{y}_{t+1}=\alpha y_t + \left( 1-\alpha \right) \bar{y}_t,\;</tex> где <tex>\bar{y}_t = \sum_{i=0}^t y_i/t,\; \alpha \in (0,1)</tex>.
+
<tex>\hat{y}_{t+d}=\alpha y_t + ( 1-\alpha ) \hat{y}_t,\; \hat{y}_0 = y_0,\; \alpha \in (0,1)</tex>.
-
== Как выбрать параметр α? ==
+
Если рассматривать прогноз на 1 шаг вперед, то <tex>\left(y_t - \hat{y}_t\right)</tex> - погрешность этого прогноза, а новый прогноз <tex>\hat{y}_{t+1}</tex> получается в результате корректировки предыдущего прогноза с учетом его ошибки - суть адаптации.
-
Очевидно, что при <tex> \alpha \rightarrow 1,\; \hat{y}_{t+1} \rightarrow y_t</tex>, а при <tex> \alpha \rightarrow 0,\; \hat{y}_{t+1} \rightarrow \bar{y}_t</tex>;
+
При краткосрочном прогнозировании желательно как можно быстрее отразить новые изменения и в то же время как можно лучше «очистить» ряд от случайных колебаний.
 +
Т.о. следует увеличивать вес более свежих наблюдений: <tex> \alpha \rightarrow 1,\; \hat{y}_{t+d} \rightarrow y_t</tex>.
 +
 
 +
С другой стороны, для сглаживания случайных отклонений, α нужно уменьшить: <tex> \alpha \rightarrow 0,\; \hat{y}_{t+1} \rightarrow \bar{y}_t</tex>.
 +
 
 +
Т.о. эти два требования находятся в противоречии. Поиск компромиссного значения α составляет задачу оптимизации модели. Обычно, α берут из интервала (0,1/3).
 +
 
 +
== Примеры ==
 +
[[Image: SalesExpSmooth.png|420px|thumb|]]
 +
Работа экспоненциального сглаживания при α=0.2 на данных ежемесячных отчетов по продажам иностранной автомобильной марки в России за период с января 2007 по октябрь 2008. Отметим резкие падения в январе и феврале, когда продажи традиционно снижаются и повышения в начале лета.
-
Обычно, α берут из интервала (0,1/3), в этом случае ряд стационарен и использование модели Брауна оправдано.
 
== Проблемы ==
== Проблемы ==
Модель работает только при небольшом горизонте прогнозирования.
Модель работает только при небольшом горизонте прогнозирования.
-
Не учитываются [[Тренд|тренд]] и [[Сезонность|сезонные]] изменения.
+
Не учитываются [[Тренд|тренд]] и [[Сезонность|сезонные]] изменения. Чтобы учесть их влияние, предлагается использовать модели: [[Модель Хольта| Хольта]] (учитывается линейный тренд) [[Модель Хольта-Уинтерса| Хольта-Уинтерса]] (мультипликативные экспоненциальный тренд и сезонность), [[Модель Тейла-Вейджа| Тейла-Вейджа]] (аддетивные линейный тренд и сезонность).
 +
 
== Литература==
== Литература==
''Лукашин Ю. П.'' Адаптивные методы краткосрочного прогнозирования временных рядов. — М.: Финансы и статистика, 2003.
''Лукашин Ю. П.'' Адаптивные методы краткосрочного прогнозирования временных рядов. — М.: Финансы и статистика, 2003.
-
== Ссылки ==
+
 
 +
''Brown R.G.'' Smoothing forecasting and prediction of discrete
 +
time series. - N.Y., 1963.
 +
 
 +
''Brown R.G., Meyer R.F.'' The fundamental theorum of
 +
exponential smoothing. Oper. Res. - 1961. - Vol.9. -№ 5.
 +
 
 +
== См. также ==
[[Модель Хольта]] — учитываются линейный тренд без сезонности.
[[Модель Хольта]] — учитываются линейный тренд без сезонности.
Строка 35: Строка 71:
[[Модель Тейла-Вейджа]] — учитываются аддитивный тренд и сезонность.
[[Модель Тейла-Вейджа]] — учитываются аддитивный тренд и сезонность.
-
{{stub}}
+
== Ссылки ==
 +
[http://en.wikipedia.org/wiki/Exponential_smoothing The exponential moving average]
 +
 
 +
[[Категория:Регрессионный анализ]]
 +
[[Категория:Прогнозирование временных рядов]]
[[Категория:Прикладная статистика]]
[[Категория:Прикладная статистика]]
[[Категория:Энциклопедия анализа данных]]
[[Категория:Энциклопедия анализа данных]]

Текущая версия

Содержание

Выявление и анализ тенденции временного ряда часто производится с помощью его выравнивания или сглаживания. Экспоненциальное сглаживание — один из простейших и распространенных приемов выравнивания ряда. Экспоненциальное сглаживание можно представить как фильтр, на вход которого последовательно поступают члены исходного ряда, а на выходе формируются текущие значения экспоненциальной средней.

Пусть X=\{x_1, \dots x_T\} - временной ряд.

Экспоненциальное сглаживание ряда осуществляется по рекуррентной формуле: S_t=\alpha x_t + \left( 1-\alpha \right) S_{t-1},\;,  \alpha \in (0,1).

Чем меньше α, тем в большей степени фильтруются, подавляются колебания исходного ряда и шума.

Если последовательно использовать рекуррентное это соотношение, то экспоненциальную среднюю S_t можно выразить через значения временного ряда X.

S_t =\alpha x_t + (1-\alpha)\left( \alpha x_{t-1} + (1-\alpha)S_{t-2}\right)= \dots = \alpha \sum_{i=0}^{t-1} (1-\alpha)^i x_{t-i} + (1-\alpha)^t S_0.

Если к моменту начала сглаживания существуют более ранние данные, то в качестве начального значения S_0 можно использовать арифметическую среднюю всех имеющихся данных или какой-то их части.

После появления работ Р. Брауна экспоненциальное сглаживание часто используется для решения задачи краткосрочного прогнозирования временных рядов.

Постановка задачи

Пусть задан временной ряд: y_i \dots y_t,\; y_i \in R.

Необходимо решить задачу прогнозирования временного ряда, т.е. найти

\hat{y}_{t+d}=f_{t,d}\left (y_1 \dots y_t \right),\; d \in \left{1,2, \dots D\right},\; D- горизонт прогнозирования, необходимо, чтобы

Q_T=\sum_{i=1}^T \left( y_i-\hat{y}_i \right) \rightarrow min

Для того, чтобы учитывать устаревание данных, введем невозрастающую последовательность весов w_0,w_1, \dots w_T,\; w_i \geq 0 , тогда

Q_T=\sum_{i=1}^T w_{T-i} \left( y_i-\hat{y}_i \right) \rightarrow min

Модель Брауна

Предположим, что D - невелико (краткосрочный прогноз), то для решения такой задачи используют модель Брауна .

\hat{y}_{t+d}=\alpha y_t + ( 1-\alpha ) \hat{y}_t,\; \hat{y}_0 = y_0,\; \alpha \in (0,1).

Если рассматривать прогноз на 1 шаг вперед, то \left(y_t - \hat{y}_t\right) - погрешность этого прогноза, а новый прогноз \hat{y}_{t+1} получается в результате корректировки предыдущего прогноза с учетом его ошибки - суть адаптации.

При краткосрочном прогнозировании желательно как можно быстрее отразить новые изменения и в то же время как можно лучше «очистить» ряд от случайных колебаний. Т.о. следует увеличивать вес более свежих наблюдений:  \alpha \rightarrow 1,\; \hat{y}_{t+d} \rightarrow y_t.

С другой стороны, для сглаживания случайных отклонений, α нужно уменьшить:  \alpha \rightarrow 0,\; \hat{y}_{t+1} \rightarrow \bar{y}_t.

Т.о. эти два требования находятся в противоречии. Поиск компромиссного значения α составляет задачу оптимизации модели. Обычно, α берут из интервала (0,1/3).

Примеры

Работа экспоненциального сглаживания при α=0.2 на данных ежемесячных отчетов по продажам иностранной автомобильной марки в России за период с января 2007 по октябрь 2008. Отметим резкие падения в январе и феврале, когда продажи традиционно снижаются и повышения в начале лета.

Проблемы

Модель работает только при небольшом горизонте прогнозирования. Не учитываются тренд и сезонные изменения. Чтобы учесть их влияние, предлагается использовать модели: Хольта (учитывается линейный тренд) Хольта-Уинтерса (мультипликативные экспоненциальный тренд и сезонность), Тейла-Вейджа (аддетивные линейный тренд и сезонность).

Литература

Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов. — М.: Финансы и статистика, 2003.

Brown R.G. Smoothing forecasting and prediction of discrete time series. - N.Y., 1963.

Brown R.G., Meyer R.F. The fundamental theorum of exponential smoothing. Oper. Res. - 1961. - Vol.9. -№ 5.

См. также

Модель Хольта — учитываются линейный тренд без сезонности.

Модель Хольта-Уинтерса — учитываются мультипликативный тренд и сезонность.

Модель Тейла-Вейджа — учитываются аддитивный тренд и сезонность.

Ссылки

The exponential moving average

Личные инструменты