Критерий Бройша-Пагана
Материал из MachineLearning.
м |
|||
Строка 35: | Строка 35: | ||
[[Изображение:het_plot.png|thumb]] | [[Изображение:het_plot.png|thumb]] | ||
[[Изображение:hom_plot.png|thumb]] | [[Изображение:hom_plot.png|thumb]] | ||
+ | |||
+ | Рассмотрим пример с использованием системы R: | ||
<pre> | <pre> | ||
- | |||
> ## моделируем наблюдаемые переменные | > ## моделируем наблюдаемые переменные | ||
> x <- rep(c(-1,1), 50) | > x <- rep(c(-1,1), 50) | ||
- | > ## генерируем гетероскедастичные | + | > ## генерируем гетероскедастичные ошибки |
> err1 <- rnorm(100, sd=rep(c(1,2), 50)) | > err1 <- rnorm(100, sd=rep(c(1,2), 50)) | ||
+ | > ## генерируем гомоскедастичные ошибки | ||
> err2 <- rnorm(100) | > err2 <- rnorm(100) | ||
> ## генерируем отклик | > ## генерируем отклик | ||
Строка 53: | Строка 55: | ||
BP | BP | ||
0.9464273 | 0.9464273 | ||
- | |||
</pre> | </pre> | ||
Версия 18:26, 27 декабря 2013
Содержание |
Определение
Критерий Бройша-Пагана (также Бреуша-Пагана, англ. Breusch-Pagan test) - один из статистических тестов для проверки наличия гетероскедастичности (то есть непостоянной дисперсии) случайных ошибок модели линейной регрессии. Применяется, если есть основания полагать, что дисперсия случайных ошибок может зависеть от некоторой совокупности переменных. В данном случае проверяется линейная зависимость дисперсии случайных ошибок от наблюдаемых переменных:
- , где .
Формулировки проверяемой и альтернативной гипотез выглядят следующим образом:
- остатки гомоскедастичны;
- неверна.
Процедура теста
Следуя методу множителей Лагранжа, получаем следующий вид статистики теста:
- .
В учебнике [C. Heij, P. de Boer, 2004] говорится о том что подсчет статистики сводится к следующей процедуре:
- Шаг 1: Исходная модель оценивается обычным МНК, вычисляются остатки ;
- Шаг 2: Вычисление оценки дисперсии остатков (в предположении их гомоскедастичности):
- ;
- Шаг 3: Вычисление стандартизированных остатков ;
- Шаг 4: Построение дополнительной регрессии квадратов стандартизированных ошибок на исходные наблюдаемые переменные
- ;
- Шаг 5: , где - коэффициент детерминации построенной на предыдущем шаге регрессии.
В работе [Breush, Pagan, 1979] установлено, что при справедливости нулевой гипотезы о гомоскедастичности остатков статистика теста имеет распределение хи-квадрат с p-1 степенями свободы .
Пример
Рассмотрим пример с использованием системы R:
> ## моделируем наблюдаемые переменные > x <- rep(c(-1,1), 50) > ## генерируем гетероскедастичные ошибки > err1 <- rnorm(100, sd=rep(c(1,2), 50)) > ## генерируем гомоскедастичные ошибки > err2 <- rnorm(100) > ## генерируем отклик > y1 <- 1 + x + err1 > y2 <- 1 + x + err2 > ## проводим тест Бройша-Пагана > bptest(y1 ~ x)$p.value BP 0.0007141008 > bptest(y2 ~ x)$p.value BP 0.9464273
Реализации
- MatLab: встроенной реализации нет, есть реализации на File Exchange.
- R: функция
bptest
в стандартном пакетеlmtest
иncvtest
в пакетеcar
.
Ссылки
- Breusch T.S., Pagan A.R. (1979). "Simple test for heteroscedasticity and random coefficient variation".
- EnWiki: Breusch–Pagan test
- C. Heij, P. de Boer (2004). "Econometric Methods with Applications in Business and Economics". Oxford University Press, pp. 344–345.
- Магнус Я.Р., Катышев П.К., Пересецкий А.А. (2007) "Эконометрика. Начальный курс". М.:Дело, стр. 179-183.