Критерий Бройша-Пагана
Материал из MachineLearning.
(Новая: '''Критерий Бройша-Пагана''' (также ''Бреуша-Пагана'', англ. ''Breusch-Pagan test'') - один из статистических тестов д...) |
м |
||
(8 промежуточных версий не показаны.) | |||
Строка 1: | Строка 1: | ||
- | '''Критерий Бройша-Пагана''' (также ''Бреуша-Пагана'', англ. ''Breusch-Pagan test'') | + | '''Критерий Бройша-Пагана''' (также ''Бреуша-Пагана'', англ. ''Breusch-Pagan test'') — один из статистических критериев для проверки наличия гетероскедастичности (то есть непостоянной дисперсии) случайных ошибок модели [[Регрессионный анализ|линейной регрессии]]. Применяется, если есть основания полагать, что дисперсия ошибок <tex>\sigma_t</tex> может зависеть от некоторой совокупности наблюдаемых переменных: |
+ | ::<tex>\sigma_t^2 = z_t^T \gamma, \;t = 1,\dots,n,</tex> | ||
+ | где <tex>z_t = (1,z_{2t},\dots,z_{pt})^T.</tex> | ||
- | + | ==Определение== | |
+ | Формулировки проверяемой и альтернативной гипотез выглядят следующим образом: | ||
- | <tex>H_0 | + | ::<tex>H_0: \quad \gamma_2 = \ldots = \gamma_p = 0 \quad \Leftrightarrow \quad \sigma_1^2 = \ldots = \sigma_n^2 \quad \Leftrightarrow </tex> остатки гомоскедастичны; |
- | <tex>H_1 | + | ::<tex>H_1: \quad H_0</tex> неверна. |
- | + | Статистика критерия может быть получена на основе метода множителей Лагранжа и имеет следующий вид: | |
- | :<tex>LM=\left (\frac{\partial l}{\partial\theta} \right )'\left (-E\left [\frac{\partial^2 l}{\partial\theta \partial\theta'} \right ] \right )^{-1}\left(\frac{\partial l}{\partial\theta} \right )</tex> | + | ::<tex>LM=\left (\frac{\partial l}{\partial\theta} \right )'\left (-E\left [\frac{\partial^2 l}{\partial\theta \partial\theta'} \right ] \right )^{-1}\left(\frac{\partial l}{\partial\theta} \right )</tex>. |
- | + | Вычисление статистики сводится к следующей процедуре<ref name="heij">C. Heij, P. de Boer (2004). [https://akela.mendelu.cz/~xhavir3/ekm/Heij.pdf "Econometric Methods with Applications in Business and Economics"]. Oxford University Press, pp. 344–345.</ref>. | |
- | * ''Шаг 1'': Исходная модель <tex> y = X\beta+\varepsilon</tex> оценивается обычным | + | * ''Шаг 1'': Исходная модель <tex> y = X\beta+\varepsilon</tex> оценивается обычным [[Метод наименьших квадратов|методом наименьших квадратов]], вычисляются остатки <tex>\varepsilon_t</tex>. |
- | * ''Шаг 2'': | + | * ''Шаг 2'': Дисперсия ошибки модели (в предположении её гомоскедастичности) оценивается как <tex>\hat{\sigma}^2 = \frac{1}{n} RSS</tex>. |
- | + | * ''Шаг 3'': Вычисляются стандартизированные остатки <tex>\frac{\varepsilon^2}{\hat{\sigma}^2} </tex>. | |
- | * ''Шаг 3'': | + | * ''Шаг 4'': Строится дополнительная регрессия квадратов стандартизированных ошибок на исходные наблюдаемые переменные: |
- | * ''Шаг 4'': | + | ::<tex> \varepsilon_t^2=\gamma_1+\gamma_2z_{2t}+\dots+\gamma_pz_{pt}+\eta_t </tex>. |
- | :<tex> \varepsilon_t^2=\gamma_1+\gamma_2z_{2t}+\dots+\gamma_pz_{pt}+\eta_t | + | * ''Шаг 5'': <tex> LM=n R^{2}</tex>, где <tex>R^{2}</tex> — [[коэффициент детерминации]] построенной на предыдущем шаге регрессии. |
- | * ''Шаг 5'' | + | |
- | :<tex> LM= | + | |
- | + | При справедливости нулевой гипотезы о гомоскедастичности остатков статистика критерия имеет распределение хи-квадрат с <tex>p-1</tex> степенями свободы. | |
+ | |||
+ | ==Пример== | ||
+ | |||
+ | [[Изображение:het_plot.png|thumb|Сгенерированный отклик <tex>y_1</tex>]] | ||
+ | [[Изображение:hom_plot.png|thumb|Сгенерированный отклик <tex>y_2</tex>]] | ||
+ | |||
+ | Рассмотрим пример с использованием системы R: | ||
+ | |||
+ | <pre> | ||
+ | > ## моделируем наблюдаемые переменные | ||
+ | > x <- rep(c(-1,1), 50) | ||
+ | > ## генерируем гетероскедастичные ошибки | ||
+ | > err1 <- rnorm(100, sd=rep(c(1,2), 50)) | ||
+ | > ## генерируем гомоскедастичные ошибки | ||
+ | > err2 <- rnorm(100) | ||
+ | > ## генерируем отклик | ||
+ | > y1 <- 1 + x + err1 | ||
+ | > y2 <- 1 + x + err2 | ||
+ | > ## проводим тест Бройша-Пагана | ||
+ | > bptest(y1 ~ x)$p.value | ||
+ | BP | ||
+ | 0.0007141008 | ||
+ | > bptest(y2 ~ x)$p.value | ||
+ | BP | ||
+ | 0.9464273 | ||
+ | </pre> | ||
+ | |||
+ | ==Реализации== | ||
+ | * MatLab: встроенной реализации нет, есть [http://www.mathworks.com/matlabcentral/fileexchange/24722-heteroskedasticity-test реализации на File Exchange]. | ||
+ | * R: функция [http://finzi.psych.upenn.edu/R/library/lmtest/html/bptest.html <code>bptest</code>] в стандартном пакете <code>lmtest</code> и [http://finzi.psych.upenn.edu/R/library/car/html/ncvTest.html <code>ncvtest</code>] в пакете <code>car</code>. | ||
+ | |||
+ | == Ссылки == | ||
+ | * Breusch T.S., Pagan A.R. (1979). [https://www.aae.wisc.edu/aae637/handouts/breusch_pagan_hetero_test_article.pdf "Simple test for heteroscedasticity and random coefficient variation"]. Econometrica, 47(5), 1287-1294. | ||
+ | * [http://en.wikipedia.org/wiki/Breusch%E2%80%93Pagan_test EnWiki: Breusch–Pagan test] | ||
+ | * Магнус Я.Р., Катышев П.К., Пересецкий А.А. (2007) [http://math.isu.ru/ru/chairs/me/files/books/magnus.pdf "Эконометрика. Начальный курс"]. М.:Дело, стр. 179-183. | ||
+ | * [http://www.youtube.com/watch?v=wzLADO24CDk YouTube: The Breusch Pagan test for heteroscedasticity] | ||
+ | |||
+ | == Примечания == | ||
+ | <references /> | ||
+ | |||
+ | [[Категория:Прикладная статистика]] | ||
+ | [[Категория:Статистические тесты]] | ||
+ | [[Категория:Линейная регрессия]] | ||
+ | [[Категория:Регрессионный анализ]] |
Текущая версия
Критерий Бройша-Пагана (также Бреуша-Пагана, англ. Breusch-Pagan test) — один из статистических критериев для проверки наличия гетероскедастичности (то есть непостоянной дисперсии) случайных ошибок модели линейной регрессии. Применяется, если есть основания полагать, что дисперсия ошибок может зависеть от некоторой совокупности наблюдаемых переменных:
где
Содержание |
Определение
Формулировки проверяемой и альтернативной гипотез выглядят следующим образом:
- остатки гомоскедастичны;
- неверна.
Статистика критерия может быть получена на основе метода множителей Лагранжа и имеет следующий вид:
- .
Вычисление статистики сводится к следующей процедуре[1].
- Шаг 1: Исходная модель оценивается обычным методом наименьших квадратов, вычисляются остатки .
- Шаг 2: Дисперсия ошибки модели (в предположении её гомоскедастичности) оценивается как .
- Шаг 3: Вычисляются стандартизированные остатки .
- Шаг 4: Строится дополнительная регрессия квадратов стандартизированных ошибок на исходные наблюдаемые переменные:
- .
- Шаг 5: , где — коэффициент детерминации построенной на предыдущем шаге регрессии.
При справедливости нулевой гипотезы о гомоскедастичности остатков статистика критерия имеет распределение хи-квадрат с степенями свободы.
Пример
Рассмотрим пример с использованием системы R:
> ## моделируем наблюдаемые переменные > x <- rep(c(-1,1), 50) > ## генерируем гетероскедастичные ошибки > err1 <- rnorm(100, sd=rep(c(1,2), 50)) > ## генерируем гомоскедастичные ошибки > err2 <- rnorm(100) > ## генерируем отклик > y1 <- 1 + x + err1 > y2 <- 1 + x + err2 > ## проводим тест Бройша-Пагана > bptest(y1 ~ x)$p.value BP 0.0007141008 > bptest(y2 ~ x)$p.value BP 0.9464273
Реализации
- MatLab: встроенной реализации нет, есть реализации на File Exchange.
- R: функция
bptest
в стандартном пакетеlmtest
иncvtest
в пакетеcar
.
Ссылки
- Breusch T.S., Pagan A.R. (1979). "Simple test for heteroscedasticity and random coefficient variation". Econometrica, 47(5), 1287-1294.
- EnWiki: Breusch–Pagan test
- Магнус Я.Р., Катышев П.К., Пересецкий А.А. (2007) "Эконометрика. Начальный курс". М.:Дело, стр. 179-183.
- YouTube: The Breusch Pagan test for heteroscedasticity