Экспоненциальное сглаживание

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 2: Строка 2:
Выявление и анализ тенденции временного ряда часто производится с помощью его выравнивания или сглаживания. Экспоненциальное сглаживание — один из простейших и распространенных приемов выравнивания ряда. Экспоненциальное сглаживание можно представить как фильтр, на вход которого последовательно поступают члены исходного ряда, а на выходе формируются текущие значения экспоненциальной средней.
Выявление и анализ тенденции временного ряда часто производится с помощью его выравнивания или сглаживания. Экспоненциальное сглаживание — один из простейших и распространенных приемов выравнивания ряда. Экспоненциальное сглаживание можно представить как фильтр, на вход которого последовательно поступают члены исходного ряда, а на выходе формируются текущие значения экспоненциальной средней.
-
Пусть <tex>X=\{x_1, \dots x_T\}</tex> -временной ряд.
+
Пусть <tex>X=\{x_1, \dots x_T\}</tex> - временной ряд.
Экспоненциальное сглаживание ряда осуществляется по рекуррентной формуле:
Экспоненциальное сглаживание ряда осуществляется по рекуррентной формуле:
-
<tex>S_t=\alpha x_t + \left( 1-\alpha \right) s_{t-1},\;</tex>, <tex> \alpha \in (0,1)</tex>.
+
<tex>S_t=\alpha x_t + \left( 1-\alpha \right) S_{t-1},\;</tex>, <tex> \alpha \in (0,1)</tex>.
Чем меньше α, тем в большей степени фильтруются, подавляются колебания исходного ряда и шума.
Чем меньше α, тем в большей степени фильтруются, подавляются колебания исходного ряда и шума.
-
Если последовательно использовать рекуррентное это соотношение, то экспоненциальную среднюю <tex>S_t</tex> можно выразить через значения временного ряда х.
+
Если последовательно использовать рекуррентное это соотношение, то экспоненциальную среднюю <tex>S_t</tex> можно выразить через значения временного ряда X.
-
<tex>S_t =\alpha x_t + (1-\alpha)\left( \alpha x_{t-1} + (1-\alpha)S_{t-2}\right)= \dots = \alpha \sum_{i=0}^t-1 (1-\alpha)^i x_{t-i} + (1-\alpha)^t S_0</tex>.
+
<tex>S_t =\alpha x_t + (1-\alpha)\left( \alpha x_{t-1} + (1-\alpha)S_{t-2}\right)= \dots = \alpha \sum_{i=0}^{t-1} (1-\alpha)^i x_{t-i} + (1-\alpha)^t S_0</tex>.
Если к моменту начала сглаживания существуют более ранние данные, то в качестве начального
Если к моменту начала сглаживания существуют более ранние данные, то в качестве начального

Версия 15:15, 11 января 2009

Содержание

Выявление и анализ тенденции временного ряда часто производится с помощью его выравнивания или сглаживания. Экспоненциальное сглаживание — один из простейших и распространенных приемов выравнивания ряда. Экспоненциальное сглаживание можно представить как фильтр, на вход которого последовательно поступают члены исходного ряда, а на выходе формируются текущие значения экспоненциальной средней.

Пусть X=\{x_1, \dots x_T\} - временной ряд.

Экспоненциальное сглаживание ряда осуществляется по рекуррентной формуле: S_t=\alpha x_t + \left( 1-\alpha \right) S_{t-1},\;,  \alpha \in (0,1).

Чем меньше α, тем в большей степени фильтруются, подавляются колебания исходного ряда и шума.

Если последовательно использовать рекуррентное это соотношение, то экспоненциальную среднюю S_t можно выразить через значения временного ряда X.

S_t =\alpha x_t + (1-\alpha)\left( \alpha x_{t-1} + (1-\alpha)S_{t-2}\right)= \dots = \alpha \sum_{i=0}^{t-1} (1-\alpha)^i x_{t-i} + (1-\alpha)^t S_0.

Если к моменту начала сглаживания существуют более ранние данные, то в качестве начального значения S_0 можно использовать арифметическую среднюю всех имеющихся данных или какой-то их части.

После появления работ Р. Брауна экспоненциальное сглаживание часто используется для решения задачи краткосрочного прогнозирования временных рядов.

Постановка задачи

Пусть задан временной ряд: y_i \dots y_t,\; y_i \in R.

Необходимо решить задачу прогнозирования временного ряда, т.е. найти

\hat{y}_{t+d}=f_{t,d}\left (y_1 \dots y_t \right),\; d \in \left{1,2, \dots D\right},\; D- горизонт прогнозирования, необходимо, чтобы

Q_T=\sum_{i=1}^T \left( y_i-\hat{y}_i \right) \rightarrow min

Для того, чтобы учитывать устаревание данных, введем невозрастающую последовательность весов w_0,w_1, \dots w_T,\; w_i \geq 0 , тогда

Q_T=\sum_{i=1}^T w_{T-i} \left( y_i-\hat{y}_i \right) \rightarrow min

Модель Брауна

Предположим, что D - невелико (краткосрочный прогноз), то для решения такой задачи используют модель Брауна .

\hat{y}_{t+d}=\alpha y_t + ( 1-\alpha ) \hat{y}_t,\; \hat{y}_0 = y_0,\; \alpha \in (0,1).

Если рассматривать прогноз на 1 шаг вперед, то (y_t — \hat{y}_t) - погрешность этого прогноза, а новый прогноз \hat{y}_{t+1} получается в результате корректировки предыдущего прогноза с учетом его ошибки - суть адаптация.

При краткосрочном прогнозировании желательно как можно быстрее отразить новые изменения и в то же время как можно лучше «очистить» ряд от случайных колебаний. Т.о., следует увеличивать вес более свежих наблюдений:  \alpha \rightarrow 1,\; \hat{y}_{t+d} \rightarrow y_t.

С другой стороны, для сглаживания случайных отклонений α нужно уменьшить:  \alpha \rightarrow 0,\; \hat{y}_{t+1} \rightarrow \bar{y}_t.

Т.о. эти два требования находятся в противоречии. Поиск компромиссного значения α составляет задачу оптимизации модели. Обычно, α берут из интервала (0,1/3), в этом случае ряд стационарен и использование модели Брауна оправдано.

Примеры

Работа экспоненциального сглаживания при α=0.2 на данных ежемесячных отчетов по продажам иностранной автомобильной марки в России за период с января 2007 по октябрь 2008. Отметим резкие падения в январе и феврале, когда продажи традиционно снижаются и повышения в начале лета.

Проблемы

Модель работает только при небольшом горизонте прогнозирования. Не учитываются тренд и сезонные изменения.

Литература

Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов. — М.: Финансы и статистика, 2003. Brown R.G. Smoothing forecasting and prediction of discrete time series. - N.Y., 1963. Brown R.G., Meyer R.F. The fundamental theorum of exponential smoothing. Oper. Res. - 1961. - Vol.9. -№ 5.

См. также

Модель Хольта — учитываются линейный тренд без сезонности.

Модель Хольта-Уинтерса — учитываются мультипликативный тренд и сезонность.

Модель Тейла-Вейджа — учитываются аддитивный тренд и сезонность.

Ссылки

The exponential moving average

Личные инструменты