Критерий Чоу

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 22: Строка 22:
== Описание критерия Чоу==
== Описание критерия Чоу==
-
Пусть <tex>\vareps_{1t}=\hat{y}_{1t}-y_t,\; \vareps_{2t}=\hat{y}_{2t}-y_t.</tex>
+
Пусть <tex>\vareps_{1t}=\hat{y}_{1t}-y_t,\; \vareps_{2t}=\hat{y}_{2t}-y_t</tex> - неточности в предсказании рядов на отрезках
-
<br/ >Будем считать, что <tex>\vareps_{1t},\; \vareps_{2t}</tex> распределены нормально с одними и теми же параметрами.
+
<tex>[T_1;T_2]</tex> и <tex>[T_2;T_3]</tex> соответственно.
 +
 
 +
Будем считать, что <tex>\vareps_{1t},\; \vareps_{2t}</tex> распределены нормально с одними и теми же параметрами.
===Нулевая гипотеза===
===Нулевая гипотеза===
-
Сформулируем нулевую гипотезу:
+
Сформулируем [[Нулевая гипотеза|нулевую гипотезу]]:
::<tex>H_0:\;</tex> структура стабильна
::<tex>H_0:\;</tex> структура стабильна
<br/ >(разбиение на две модели не способствовало лучшему прогнозированию)
<br/ >(разбиение на две модели не способствовало лучшему прогнозированию)
Строка 32: Строка 34:
===Статистика Чоу===
===Статистика Чоу===
Будем использовать следующие обозначения:
Будем использовать следующие обозначения:
-
*<tex>\vareps_t=\hat{y}_t-y_t</tex>
+
*<tex>\vareps_t=\hat{y}_t-y_t</tex> - неточность в предсказании ряда на отрезке <tex>[T_1;T_3]</tex>
*<tex>RSS</tex> - [[Остаточная сумма квадратов|остаточная сумма квадратов]] для всего интервала <tex>[T_1;T_3]</tex>
*<tex>RSS</tex> - [[Остаточная сумма квадратов|остаточная сумма квадратов]] для всего интервала <tex>[T_1;T_3]</tex>
*<tex>RSS_1=\sum_{t=T_1}^{T_2-1}\vareps_{t1}^2</tex>
*<tex>RSS_1=\sum_{t=T_1}^{T_2-1}\vareps_{t1}^2</tex>
Строка 38: Строка 40:
Статистика Чоу:
Статистика Чоу:
::<tex>F(T_2)=\frac{RSS-\bigl(RSS_1+RSS_2\bigr)}{RSS_1+RSS_2}\cdot\frac{n-k_1+k_2}{k_1+k_2-k}</tex>
::<tex>F(T_2)=\frac{RSS-\bigl(RSS_1+RSS_2\bigr)}{RSS_1+RSS_2}\cdot\frac{n-k_1+k_2}{k_1+k_2-k}</tex>
-
<tex>n=T_3-T_1+1</tex>
+
<br/ ><tex>k1</tex> - число параметров модели, предсказывающей поведение ряда на отрезке <tex>[T_1;T_2]</tex>
 +
<br/ ><tex>k2</tex> - число параметров модели, предсказывающей поведение ряда на отрезке <tex>[T_2;T_3]</tex>
 +
<br/ ><tex>k</tex> - число параметров модели, предсказывающей поведение ряда на отрезке <tex>[T_1;T_3]</tex>
 +
(в общем случае <tex>k\neq k1+k2</tex>)
 +
<br/ ><tex>n=T_3-T_1+1</tex>
-
Статистика Чоу имеет [[Распределение Фишера|распределение Фишера]] с <tex>k_1+k_2-k</tex> и <tex>n-k_1-k_2</tex> степенями свободы.
+
Статистика Чоу имеет [[Критерий Фишера|распределение Фишера]] с <tex>k_1+k_2-k</tex> и <tex>n-k_1-k_2</tex> степенями свободы.
=== Критическая область ===
=== Критическая область ===
Строка 46: Строка 52:
<tex>\alpha</tex> - это область
<tex>\alpha</tex> - это область
::<tex>\Omega_{\alpha}:\; F(T_2)>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex>
::<tex>\Omega_{\alpha}:\; F(T_2)>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex>
-
где <tex>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex> - [[квантиль Фишера]].
+
где <tex>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex> - [[квантиль]] Фишера.
Если гипотеза <tex>H_0</tex> отвергается, то необходимо использовать две модели.
Если гипотеза <tex>H_0</tex> отвергается, то необходимо использовать две модели.
Строка 76: Строка 82:
*[http://en.wikipedia.org/wiki/Chow_test Chow test] (Wikipedia)
*[http://en.wikipedia.org/wiki/Chow_test Chow test] (Wikipedia)
-
[[Категория: Параметрическая проверка гипотез]]
+
[[Категория:Энциклопедия анализа данных]]
 +
[[Категория:Анализ временных рядов]]
{{stub}}
{{stub}}

Версия 09:36, 11 января 2009

Тест Чоу позволяет оценить значимость улучшения регрессионной модели после разделения исходной выборки на части. Это модификация однопараметрической экспоненциальной модели с коррекцией коэффициента линейного тренда. В методе Чоу происходит адаптация параметра к изменениям в дианамике ряда.

Примером использования данного критерия может служить задача, которую решал Чоу. Он тестировал свой метод на рядах месячных данных о сделках на различные виды продукции: перчатки, смазочные материалы, сальники, подшипники и т.д. Данные представляли собой разнообразные образцы поведения экономических временных рядов, включая циклическое движение. В 59 случаев из 60 предлагаемый метод показал преимущества перед стандартной процедурой и в одном случае результаты были почти одинаковы.

Содержание

Постановка задачи

Основной задачей в этом разделе является обнаружение структурных изменений.

Пусть на временном интервале [T_1;T_3] прогноз для момента t по уже полученным данным y_t имеет следующий вид:

\hat{y}_t=\sum_{j=1}^kf_j(t)\alpha_j

f_j(t) - признаки (информация), по которым строится прогноз на момент времени t, т.е. могут быть определены только до t-1го момента

Варианты выбора функции f_j:

Выделим внутри рассматриваемого временного интервала момент T_2. Пусть прогноз на отрезке

[T_1;T_2]:\; \hat{y}_{1t}=\sum_{j=1}^{k_1}f_{1j}(t)\alpha_{1j};
[T_2;T_3]:\; \hat{y}_{2t}=\sum_{j=1}^{k_2}f_{2j}(t)\alpha_{2j}

Определим, насколько же необходимо менять модель в момент времени T_2.

Описание критерия Чоу

Пусть \vareps_{1t}=\hat{y}_{1t}-y_t,\; \vareps_{2t}=\hat{y}_{2t}-y_t - неточности в предсказании рядов на отрезках [T_1;T_2] и [T_2;T_3] соответственно.

Будем считать, что \vareps_{1t},\; \vareps_{2t} распределены нормально с одними и теми же параметрами.

Нулевая гипотеза

Сформулируем нулевую гипотезу:

H_0:\; структура стабильна


(разбиение на две модели не способствовало лучшему прогнозированию)

Статистика Чоу

Будем использовать следующие обозначения:

Статистика Чоу:

F(T_2)=\frac{RSS-\bigl(RSS_1+RSS_2\bigr)}{RSS_1+RSS_2}\cdot\frac{n-k_1+k_2}{k_1+k_2-k}


k1 - число параметров модели, предсказывающей поведение ряда на отрезке [T_1;T_2]
k2 - число параметров модели, предсказывающей поведение ряда на отрезке [T_2;T_3]
k - число параметров модели, предсказывающей поведение ряда на отрезке [T_1;T_3] (в общем случае k\neq k1+k2)
n=T_3-T_1+1

Статистика Чоу имеет распределение Фишера с k_1+k_2-k и n-k_1-k_2 степенями свободы.

Критическая область

Для критерия Чоу критическая область при уровне значимости \alpha - это область

\Omega_{\alpha}:\; F(T_2)>F_{k_1+k2-k,n-k_1-k_2,\alpha}

где F_{k_1+k2-k,n-k_1-k_2,\alpha} - квантиль Фишера.

Если гипотеза H_0 отвергается, то необходимо использовать две модели.

Примечание

Если момент времени T_2 неизвестен, то рекомендуется следующее значение:

T_2=\arg\max\limits_{T_2}F(T_2)


Литература

Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов.. — М.: Финансы и статистика, 2003. — 416 с. — ISBN 5-279-02740-5

См. также

Ссылки

Личные инструменты