Критерий Чоу

Материал из MachineLearning.

Перейти к: навигация, поиск

Тест Чоу позволяет оценить значимость улучшения регрессионной модели после разделения исходной выборки на части. Это модификация однопараметрической экспоненциальной модели с коррекцией коэффициента линейного тренда. В методе Чоу происходит адаптация параметра к изменениям в дианамике ряда.

Примером использования данного критерия может служить задача, которую решал Чоу. Он тестировал свой метод на рядах месячных данных о сделках на различные виды продукции: перчатки, смазочные материалы, сальники, подшипники и т.д. Данные представляли собой разнообразные образцы поведения экономических временных рядов, включая циклическое движение. В 59 случаев из 60 предлагаемый метод показал преимущества перед стандартной процедурой и в одном случае результаты были почти одинаковы.

Содержание

Постановка задачи

Основной задачей в этом разделе является обнаружение структурных изменений.

Пусть на временном интервале [T_1;T_3] прогноз для момента t по уже полученным данным y_t имеет следующий вид:

\hat{y}_t=\sum_{j=1}^kf_j(t)\alpha_j

f_j(t) - признаки (информация), по которым строится прогноз на момент времени t, т.е. могут быть определены только до t-1го момента

Варианты выбора функции f_j:

Выделим внутри рассматриваемого временного интервала момент T_2. Пусть прогноз на отрезке

[T_1;T_2]:\; \hat{y}_{1t}=\sum_{j=1}^{k_1}f_{1j}(t)\alpha_{1j};
[T_2;T_3]:\; \hat{y}_{2t}=\sum_{j=1}^{k_2}f_{2j}(t)\alpha_{2j}

Определим, насколько же необходимо менять модель в момент времени T_2.

Описание критерия Чоу

Пусть \vareps_{1t}=\hat{y}_{1t}-y_t,\; \vareps_{2t}=\hat{y}_{2t}-y_t - неточности в предсказании рядов на отрезках [T_1;T_2] и [T_2;T_3] соответственно.

Будем считать, что \vareps_{1t},\; \vareps_{2t} распределены нормально с одними и теми же параметрами.

Нулевая гипотеза

Сформулируем нулевую гипотезу:

H_0:\; структура стабильна


(разбиение на две модели не способствовало лучшему прогнозированию)

Статистика Чоу

Будем использовать следующие обозначения:

Статистика Чоу:

F(T_2)=\frac{RSS-\bigl(RSS_1+RSS_2\bigr)}{RSS_1+RSS_2}\cdot\frac{n-k_1+k_2}{k_1+k_2-k}

 k1 - число параметров модели, предсказывающей поведение ряда на отрезке [T_1;T_2]
k2 - число параметров модели, предсказывающей поведение ряда на отрезке [T_2;T_3]
k - число параметров модели, предсказывающей поведение ряда на отрезке [T_1;T_3] (в общем случае k\neq k1+k2)
n=T_3-T_1+1

Статистика Чоу имеет распределение Фишера с k_1+k_2-k и n-k_1-k_2 степенями свободы.

Критическая область

Для критерия Чоу критическая область при уровне значимости \alpha - это область

\Omega_{\alpha}:\; F(T_2)>F_{k_1+k2-k,n-k_1-k_2,\alpha}

где F_{k_1+k2-k,n-k_1-k_2,\alpha} - квантиль Фишера.

Если гипотеза H_0 отвергается, то необходимо использовать две модели.

Примечание

Если момент времени T_2 неизвестен, то рекомендуется следующее значение:

T_2=\arg\max\limits_{T_2}F(T_2)


Литература

Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов.. — М.: Финансы и статистика, 2003. — 416 с. — ISBN 5-279-02740-5

См. также

Ссылки

Личные инструменты