Критерий Диболда-Мариано
Материал из MachineLearning.
|
Критерий Диболда-Мариано (Diebold-Mariano test) -- статистический тест, позволяющий сравнивать качество прогнозов временного ряда двух предсказательных моделей. Впервые был представлен в работе Диболда и Мариано в 1995 году, где был приведен небольшой обзор тестов такого рода. Этот тест является устойчивым к различным отклонениям от стандартных предположенный о свойствах ошибок прогнозирования. А именно предполагается, что ошибки прогнозирования могут не удовлетворять классическим критериям, т.е. могут не быть нормальными, иметь ненулевой средний уровень, а также быть серийно и одновременно коррелированными.
Описание
Пусть , -- прогнозные значения модели A, -- прогнозные значения модели B, и -- остатки прогнозов обеих моделей, -- функция потерь, .
Если является слабостационарным временным рядом, то можно показать, что , где , - неизвестное матожидание процесса, - его дисперсия. Проверямая в критерии гипотеза : , альтернатива (двусторонняя): . Вычисляемая статистика: , где , где -- автоковариация порядка . Гипотезе соответствует .
Дополнительно
Рассмотренный способ проверки гипотезы о совпадении каче�ства прогнозов, основанных на различных моделях, является на�дежным для широкого класса функций потерь. В частности, функ�ции потерь не обязаны быть квадратическими или симметричными и непрерывными. Помимо этого, отметим еще раз, что ошибки прогнозирования могут не быть гауссовскими, а также могут иметь ненулевой средний уровень и быть коррелированными (как серий�но, так и одновременно). Последнее допущение особенно важно, поскольку сравниваемые прогнозы являются прогнозами одного и того же временного ряда и основаны на довольно сильно совпа�дающих информационных множествах, вследствие чего ошибки прогнозирования могут быть сильно одновременно коррелирован�ными. Однако ошибки прогнозирования в общем случае являются серийно коррелированными, и предложенный тест позволяет учи�тывать и эту особенность.
Также возможны модификации критерия для односторонних альтернатив и для коротких временных рядов.
Программные реализации
- В MATLAB функция parcorr
- В R функция pacf из пакета stats.
- В Python функция statsmodels.tsa.stattools.pacf библиотеки statsmodels.
Ссылки
- Autocorrelation and Partial Autocorrelation. MATLAB R2013b Documentation
- Partial Autocorrelation function on Wikipedia
- Статистический анализ данных (курс лекций, К.В. Воронцов)
- Box, G. E. P.; Jenkins, G. M.; Reinsel, G. C. (2008). Time Series Analysis, Forecasting and Control (4th ed.). Hoboken, NJ: Wiley. ISBN 9780470272848.