Критерий Чоу
Материал из MachineLearning.
Строка 22: | Строка 22: | ||
== Описание критерия Чоу== | == Описание критерия Чоу== | ||
- | Пусть <tex>\vareps_{1t}=\hat{y}_{1t}-y_t,\; \vareps_{2t}=\hat{y}_{2t}-y_t | + | Пусть <tex>\vareps_{1t}=\hat{y}_{1t}-y_t,\; \vareps_{2t}=\hat{y}_{2t}-y_t</tex> - неточности в предсказании рядов на отрезках |
- | < | + | <tex>[T_1;T_2]</tex> и <tex>[T_2;T_3]</tex> соответственно. |
+ | |||
+ | Будем считать, что <tex>\vareps_{1t},\; \vareps_{2t}</tex> распределены нормально с одними и теми же параметрами. | ||
===Нулевая гипотеза=== | ===Нулевая гипотеза=== | ||
- | Сформулируем нулевую гипотезу: | + | Сформулируем [[Нулевая гипотеза|нулевую гипотезу]]: |
::<tex>H_0:\;</tex> структура стабильна | ::<tex>H_0:\;</tex> структура стабильна | ||
<br/ >(разбиение на две модели не способствовало лучшему прогнозированию) | <br/ >(разбиение на две модели не способствовало лучшему прогнозированию) | ||
Строка 32: | Строка 34: | ||
===Статистика Чоу=== | ===Статистика Чоу=== | ||
Будем использовать следующие обозначения: | Будем использовать следующие обозначения: | ||
- | *<tex>\vareps_t=\hat{y}_t-y_t</tex> | + | *<tex>\vareps_t=\hat{y}_t-y_t</tex> - неточность в предсказании ряда на отрезке <tex>[T_1;T_3]</tex> |
*<tex>RSS</tex> - [[Остаточная сумма квадратов|остаточная сумма квадратов]] для всего интервала <tex>[T_1;T_3]</tex> | *<tex>RSS</tex> - [[Остаточная сумма квадратов|остаточная сумма квадратов]] для всего интервала <tex>[T_1;T_3]</tex> | ||
*<tex>RSS_1=\sum_{t=T_1}^{T_2-1}\vareps_{t1}^2</tex> | *<tex>RSS_1=\sum_{t=T_1}^{T_2-1}\vareps_{t1}^2</tex> | ||
Строка 38: | Строка 40: | ||
Статистика Чоу: | Статистика Чоу: | ||
::<tex>F(T_2)=\frac{RSS-\bigl(RSS_1+RSS_2\bigr)}{RSS_1+RSS_2}\cdot\frac{n-k_1+k_2}{k_1+k_2-k}</tex> | ::<tex>F(T_2)=\frac{RSS-\bigl(RSS_1+RSS_2\bigr)}{RSS_1+RSS_2}\cdot\frac{n-k_1+k_2}{k_1+k_2-k}</tex> | ||
- | <tex>n=T_3-T_1+1</tex> | + | <br/ ><tex>k1</tex> - число параметров модели, предсказывающей поведение ряда на отрезке <tex>[T_1;T_2]</tex> |
+ | <br/ ><tex>k2</tex> - число параметров модели, предсказывающей поведение ряда на отрезке <tex>[T_2;T_3]</tex> | ||
+ | <br/ ><tex>k</tex> - число параметров модели, предсказывающей поведение ряда на отрезке <tex>[T_1;T_3]</tex> | ||
+ | (в общем случае <tex>k\neq k1+k2</tex>) | ||
+ | <br/ ><tex>n=T_3-T_1+1</tex> | ||
- | Статистика Чоу имеет [[ | + | Статистика Чоу имеет [[Критерий Фишера|распределение Фишера]] с <tex>k_1+k_2-k</tex> и <tex>n-k_1-k_2</tex> степенями свободы. |
=== Критическая область === | === Критическая область === | ||
Строка 46: | Строка 52: | ||
<tex>\alpha</tex> - это область | <tex>\alpha</tex> - это область | ||
::<tex>\Omega_{\alpha}:\; F(T_2)>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex> | ::<tex>\Omega_{\alpha}:\; F(T_2)>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex> | ||
- | где <tex>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex> - [[квантиль | + | где <tex>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex> - [[квантиль]] Фишера. |
Если гипотеза <tex>H_0</tex> отвергается, то необходимо использовать две модели. | Если гипотеза <tex>H_0</tex> отвергается, то необходимо использовать две модели. | ||
Строка 76: | Строка 82: | ||
*[http://en.wikipedia.org/wiki/Chow_test Chow test] (Wikipedia) | *[http://en.wikipedia.org/wiki/Chow_test Chow test] (Wikipedia) | ||
- | [[Категория: | + | [[Категория:Энциклопедия анализа данных]] |
+ | [[Категория:Анализ временных рядов]] | ||
{{stub}} | {{stub}} |
Версия 09:36, 11 января 2009
Тест Чоу позволяет оценить значимость улучшения регрессионной модели после разделения исходной выборки на части. Это модификация однопараметрической экспоненциальной модели с коррекцией коэффициента линейного тренда. В методе Чоу происходит адаптация параметра к изменениям в дианамике ряда.
Примером использования данного критерия может служить задача, которую решал Чоу. Он тестировал свой метод на рядах месячных данных о сделках на различные виды продукции: перчатки, смазочные материалы, сальники, подшипники и т.д. Данные представляли собой разнообразные образцы поведения экономических временных рядов, включая циклическое движение. В 59 случаев из 60 предлагаемый метод показал преимущества перед стандартной процедурой и в одном случае результаты были почти одинаковы.
Содержание |
Постановка задачи
Основной задачей в этом разделе является обнаружение структурных изменений.
Пусть на временном интервале прогноз для момента по уже полученным данным имеет следующий вид:
- признаки (информация), по которым строится прогноз на момент времени , т.е. могут быть определены только до го момента
Варианты выбора функции :
- может быть функцией времени ()
- члены авторегрессии:
- - внешние данные
Выделим внутри рассматриваемого временного интервала момент . Пусть прогноз на отрезке
Определим, насколько же необходимо менять модель в момент времени .
Описание критерия Чоу
Пусть - неточности в предсказании рядов на отрезках и соответственно.
Будем считать, что распределены нормально с одними и теми же параметрами.
Нулевая гипотеза
Сформулируем нулевую гипотезу:
- структура стабильна
(разбиение на две модели не способствовало лучшему прогнозированию)
Статистика Чоу
Будем использовать следующие обозначения:
- - неточность в предсказании ряда на отрезке
- - остаточная сумма квадратов для всего интервала
Статистика Чоу:
- число параметров модели, предсказывающей поведение ряда на отрезке
- число параметров модели, предсказывающей поведение ряда на отрезке
- число параметров модели, предсказывающей поведение ряда на отрезке
(в общем случае )
Статистика Чоу имеет распределение Фишера с и степенями свободы.
Критическая область
Для критерия Чоу критическая область при уровне значимости - это область
где - квантиль Фишера.
Если гипотеза отвергается, то необходимо использовать две модели.
Примечание
Если момент времени неизвестен, то рекомендуется следующее значение:
Литература
Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов.. — М.: Финансы и статистика, 2003. — 416 с. — ISBN 5-279-02740-5