Критерий Чоу
Материал из MachineLearning.
(Новая: Тест Чоу позволяет оценить значимость улучшения регрессионной модели после разделения исходной выб...) |
|||
(2 промежуточные версии не показаны) | |||
Строка 1: | Строка 1: | ||
- | Тест Чоу позволяет оценить значимость улучшения регрессионной модели после разделения исходной выборки на части. | + | '''Тест Чоу''' позволяет оценить значимость улучшения регрессионной модели после разделения исходной выборки на части. Это модификация однопараметрической [[Экспоненциальное сглаживание|экспоненциальной модели]] с коррекцией коэффициента линейного тренда. В методе Чоу происходит адаптация параметра к изменениям в дианамике ряда. |
+ | |||
+ | Примером использования данного критерия может служить задача, которую решал Чоу. Он тестировал свой метод на рядах месячных данных о сделках на различные виды продукции: перчатки, смазочные материалы, сальники, подшипники и т.д. Данные представляли собой разнообразные образцы поведения экономических временных рядов, включая циклическое движение. В 59 случаев из 60 предлагаемый метод показал преимущества перед стандартной процедурой и в одном случае результаты были почти одинаковы. | ||
==Постановка задачи== | ==Постановка задачи== | ||
Строка 8: | Строка 10: | ||
::<tex>\hat{y}_t=\sum_{j=1}^kf_j(t)\alpha_j</tex> | ::<tex>\hat{y}_t=\sum_{j=1}^kf_j(t)\alpha_j</tex> | ||
<tex>f_j(t)</tex> - признаки (информация), по которым строится прогноз на момент времени <tex>t</tex>, т.е. могут быть определены только до <tex>t-1</tex>го момента | <tex>f_j(t)</tex> - признаки (информация), по которым строится прогноз на момент времени <tex>t</tex>, т.е. могут быть определены только до <tex>t-1</tex>го момента | ||
+ | |||
+ | Варианты выбора функции <tex>f_j</tex>: | ||
+ | *<tex>f_j</tex> может быть функцией времени (<tex>t, t^2,\ldots</tex>) | ||
+ | *члены [[Авторегрессия|авторегрессии]]: <tex>f_j=y_{t-1},y_{t-2},\ldots</tex> | ||
+ | *<tex>f_j</tex> - внешние данные | ||
Выделим внутри рассматриваемого временного интервала момент <tex>T_2</tex>. Пусть прогноз на отрезке | Выделим внутри рассматриваемого временного интервала момент <tex>T_2</tex>. Пусть прогноз на отрезке | ||
Строка 15: | Строка 22: | ||
== Описание критерия Чоу== | == Описание критерия Чоу== | ||
- | Пусть <tex>\vareps_{1t}=\hat{y}_{1t}-y_t,\; \vareps_{2t}=\hat{y}_{2t}-y_t | + | Пусть <tex>\vareps_{1t}=\hat{y}_{1t}-y_t,\; \vareps_{2t}=\hat{y}_{2t}-y_t</tex> - неточности в предсказании рядов на отрезках |
- | < | + | <tex>[T_1;T_2]</tex> и <tex>[T_2;T_3]</tex> соответственно. |
+ | |||
+ | Будем считать, что <tex>\vareps_{1t},\; \vareps_{2t}</tex> распределены нормально с одними и теми же параметрами. | ||
===Нулевая гипотеза=== | ===Нулевая гипотеза=== | ||
- | Сформулируем нулевую гипотезу: | + | Сформулируем [[Нулевая гипотеза|нулевую гипотезу]]: |
::<tex>H_0:\;</tex> структура стабильна | ::<tex>H_0:\;</tex> структура стабильна | ||
<br/ >(разбиение на две модели не способствовало лучшему прогнозированию) | <br/ >(разбиение на две модели не способствовало лучшему прогнозированию) | ||
Строка 25: | Строка 34: | ||
===Статистика Чоу=== | ===Статистика Чоу=== | ||
Будем использовать следующие обозначения: | Будем использовать следующие обозначения: | ||
- | *<tex>\vareps_t=\hat{y}_t-y_t</tex> | + | *<tex>\vareps_t=\hat{y}_t-y_t</tex> - неточность в предсказании ряда на отрезке <tex>[T_1;T_3]</tex> |
*<tex>RSS</tex> - [[Остаточная сумма квадратов|остаточная сумма квадратов]] для всего интервала <tex>[T_1;T_3]</tex> | *<tex>RSS</tex> - [[Остаточная сумма квадратов|остаточная сумма квадратов]] для всего интервала <tex>[T_1;T_3]</tex> | ||
*<tex>RSS_1=\sum_{t=T_1}^{T_2-1}\vareps_{t1}^2</tex> | *<tex>RSS_1=\sum_{t=T_1}^{T_2-1}\vareps_{t1}^2</tex> | ||
Строка 31: | Строка 40: | ||
Статистика Чоу: | Статистика Чоу: | ||
::<tex>F(T_2)=\frac{RSS-\bigl(RSS_1+RSS_2\bigr)}{RSS_1+RSS_2}\cdot\frac{n-k_1+k_2}{k_1+k_2-k}</tex> | ::<tex>F(T_2)=\frac{RSS-\bigl(RSS_1+RSS_2\bigr)}{RSS_1+RSS_2}\cdot\frac{n-k_1+k_2}{k_1+k_2-k}</tex> | ||
- | |||
- | Статистика Чоу имеет [[ | + | <tex> k1</tex> - число параметров модели, предсказывающей поведение ряда на отрезке <tex>[T_1;T_2]</tex> |
+ | <br/ ><tex>k2</tex> - число параметров модели, предсказывающей поведение ряда на отрезке <tex>[T_2;T_3]</tex> | ||
+ | <br/ ><tex>k</tex> - число параметров модели, предсказывающей поведение ряда на отрезке <tex>[T_1;T_3]</tex> | ||
+ | (в общем случае <tex>k\neq k1+k2</tex>) | ||
+ | <br/ ><tex>n=T_3-T_1+1</tex> | ||
+ | |||
+ | Статистика Чоу имеет [[Критерий Фишера|распределение Фишера]] с <tex>k_1+k_2-k</tex> и <tex>n-k_1-k_2</tex> степенями свободы. | ||
=== Критическая область === | === Критическая область === | ||
Строка 39: | Строка 53: | ||
<tex>\alpha</tex> - это область | <tex>\alpha</tex> - это область | ||
::<tex>\Omega_{\alpha}:\; F(T_2)>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex> | ::<tex>\Omega_{\alpha}:\; F(T_2)>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex> | ||
- | где <tex>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex> - [[квантиль | + | где <tex>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex> - [[квантиль]] Фишера. |
Если гипотеза <tex>H_0</tex> отвергается, то необходимо использовать две модели. | Если гипотеза <tex>H_0</tex> отвергается, то необходимо использовать две модели. | ||
Строка 66: | Строка 80: | ||
== Ссылки == | == Ссылки == | ||
- | *[http://www.basegroup.ru/glossary/definitions/test_chow/ ChowTest](BaseGroup) | + | *[http://www.basegroup.ru/glossary/definitions/test_chow/ ChowTest] (BaseGroup) |
+ | *[http://en.wikipedia.org/wiki/Chow_test Chow test] (Wikipedia) | ||
+ | |||
+ | [[Категория:Энциклопедия анализа данных]] | ||
- | [[Категория: | + | [[Категория:Анализ временных рядов]] |
{{stub}} | {{stub}} |
Текущая версия
Тест Чоу позволяет оценить значимость улучшения регрессионной модели после разделения исходной выборки на части. Это модификация однопараметрической экспоненциальной модели с коррекцией коэффициента линейного тренда. В методе Чоу происходит адаптация параметра к изменениям в дианамике ряда.
Примером использования данного критерия может служить задача, которую решал Чоу. Он тестировал свой метод на рядах месячных данных о сделках на различные виды продукции: перчатки, смазочные материалы, сальники, подшипники и т.д. Данные представляли собой разнообразные образцы поведения экономических временных рядов, включая циклическое движение. В 59 случаев из 60 предлагаемый метод показал преимущества перед стандартной процедурой и в одном случае результаты были почти одинаковы.
Содержание |
Постановка задачи
Основной задачей в этом разделе является обнаружение структурных изменений.
Пусть на временном интервале прогноз для момента по уже полученным данным имеет следующий вид:
- признаки (информация), по которым строится прогноз на момент времени , т.е. могут быть определены только до го момента
Варианты выбора функции :
- может быть функцией времени ()
- члены авторегрессии:
- - внешние данные
Выделим внутри рассматриваемого временного интервала момент . Пусть прогноз на отрезке
Определим, насколько же необходимо менять модель в момент времени .
Описание критерия Чоу
Пусть - неточности в предсказании рядов на отрезках и соответственно.
Будем считать, что распределены нормально с одними и теми же параметрами.
Нулевая гипотеза
Сформулируем нулевую гипотезу:
- структура стабильна
(разбиение на две модели не способствовало лучшему прогнозированию)
Статистика Чоу
Будем использовать следующие обозначения:
- - неточность в предсказании ряда на отрезке
- - остаточная сумма квадратов для всего интервала
Статистика Чоу:
- число параметров модели, предсказывающей поведение ряда на отрезке
- число параметров модели, предсказывающей поведение ряда на отрезке
- число параметров модели, предсказывающей поведение ряда на отрезке
(в общем случае )
Статистика Чоу имеет распределение Фишера с и степенями свободы.
Критическая область
Для критерия Чоу критическая область при уровне значимости - это область
где - квантиль Фишера.
Если гипотеза отвергается, то необходимо использовать две модели.
Примечание
Если момент времени неизвестен, то рекомендуется следующее значение:
Литература
Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов.. — М.: Финансы и статистика, 2003. — 416 с. — ISBN 5-279-02740-5