Доверительные интервалы для параметров регрессии
Материал из MachineLearning.
(Различия между версиями)
(Новая: После того как были изучены статистические свойства МНК-оценок коэффициентов регрессии, можно пер...) |
|||
Строка 1: | Строка 1: | ||
- | После того как были изучены [[статистические свойства МНК-оценок | + | После того как были изучены [[статистические свойства МНК-оценок коэффициентов регрессии]], можно переходить к построению |
- | коэффициентов регрессии]], можно переходить к построению | + | [[доверительный интервал|доверительных интервалов]] для коэффициентов регрессии, дисперсии шума, а также прогнозного |
- | [[доверительный интервал|доверительных интервалов]] для | + | |
- | коэффициентов регрессии, дисперсии шума, а также прогнозного | + | |
значения отклика. | значения отклика. | ||
Строка 9: | Строка 7: | ||
* Работаем в предположениях, что выполнены [[статистические свойства МНК-оценок коэффициентов регрессии|ОП1, ОП2 и ДП3]]. Тогда можем воспользовать тем свойством, что величина | * Работаем в предположениях, что выполнены [[статистические свойства МНК-оценок коэффициентов регрессии|ОП1, ОП2 и ДП3]]. Тогда можем воспользовать тем свойством, что величина | ||
- | ::<tex>\frac{c^T(\hat\theta-\theta)}{\hat\sigma\sqrt{c^T(X^TX)^{-1}c}} | + | ::<tex>\frac{c^T(\hat\theta-\theta)}{\hat\sigma\sqrt{c^T(X^TX)^{-1}c}}\sim t_{n-k}</tex> |
- | \sim t_{n-k}</tex> :имеет [[распределение Стьюдента]] с | + | :имеет [[распределение Стьюдента]] с <tex>n-k</tex> степенями свободы. |
- | <tex>n-k</tex> степенями свободы. | + | |
* Далее, если взять <tex>c = (0\cdots 01\limits^j 0\cdots 0)</tex> (т.е. произведение <tex>c^T\hat\theta</tex> выделяет <tex>j</tex>-ю компоненту вектора <tex>\hat\theta</tex>), то получим | * Далее, если взять <tex>c = (0\cdots 01\limits^j 0\cdots 0)</tex> (т.е. произведение <tex>c^T\hat\theta</tex> выделяет <tex>j</tex>-ю компоненту вектора <tex>\hat\theta</tex>), то получим | ||
- | ::<tex>\Delta\hat\theta = | + | ::<tex>\Delta\hat\theta = t_{n-k,1-\frac{\alpha}2}\hat\sigma\sqrt{(X^TX)^{-1}_{jj}},</tex> |
- | t_{n-k,1-\frac{\alpha}2}\hat\sigma\sqrt{(X^TX)^{-1}_{jj}},</tex> | + | :где <tex>t_{\alpha}</tex> есть <tex>\alpha</tex>-[[квантиль]] распределения Стьюдента с <tex>n-k</tex> степенями свободы. |
- | :где <tex>t_{\alpha}</tex> есть <tex>\alpha</tex>-[[квантиль]] | + | |
- | распределения Стьюдента с <tex>n-k</tex> степенями свободы. | + | |
*Тогда двусторонний [[доверительный интервал]] с доверительной вероятностью <tex>1-\alpha</tex> для коэффициента регрессии <tex>\theta_j</tex> будет иметь вид: | *Тогда двусторонний [[доверительный интервал]] с доверительной вероятностью <tex>1-\alpha</tex> для коэффициента регрессии <tex>\theta_j</tex> будет иметь вид: | ||
- | ::<tex>\hat\theta_j-\Delta\hat\theta_j \leq \theta_j \leq | + | ::<tex>\hat\theta_j-\Delta\hat\theta_j \leq \theta_j \leq \hat\theta_j+\Delta\hat\theta_j.</tex> |
- | \hat\theta_j+\Delta\hat\theta_j.</tex> | + | |
==Доверительный интервал для дисперсии шума== | ==Доверительный интервал для дисперсии шума== | ||
Строка 27: | Строка 21: | ||
*Регрессионные остатки (шум) <tex>\varepsilon_i</tex> имеют нормальное распределние <tex>N(0,\sigma^2)</tex>. Для анализа неизвестной дисперсии <tex>\sigma^2</tex> шума может быть использовано свойство, что [[многомерная случайная величина|случайная величина]] | *Регрессионные остатки (шум) <tex>\varepsilon_i</tex> имеют нормальное распределние <tex>N(0,\sigma^2)</tex>. Для анализа неизвестной дисперсии <tex>\sigma^2</tex> шума может быть использовано свойство, что [[многомерная случайная величина|случайная величина]] | ||
- | ::<tex>\frac{RSS}{\sigma^2} \sim \chi^2_{n-k}</tex> :распределена по | + | ::<tex>\frac{RSS}{\sigma^2} \sim \chi^2_{n-k}</tex> |
- | [[распределение хи-квадрат|закону хи-квадрат]] с <tex>n-k</tex> | + | :распределена по [[распределение хи-квадрат|закону хи-квадрат]] с <tex>n-k</tex> степенями свободы. |
- | степенями свободы. | + | |
*Тогда доверительный интервал с доверительной вероятностью <tex>1-\alpha</tex> для дисперсии шума равен: | *Тогда доверительный интервал с доверительной вероятностью <tex>1-\alpha</tex> для дисперсии шума равен: | ||
- | ::<tex>\frac{RSS}{\chi^2_{n-k,\frac{\alpha}2}} \leq \sigma^2 \leq | + | ::<tex>\frac{RSS}{\chi^2_{n-k,\frac{\alpha}2}} \leq \sigma^2 \leq \frac{RSS}{\chi^2_{n-k,1-\frac{\alpha}2}},</tex> |
- | \frac{RSS}{\chi^2_{n-k,1-\frac{\alpha}2}},</tex> :где | + | :где <tex>\chi_{\alpha}</tex> есть <tex>\alpha</tex>-[[квантиль]] распределения хи-квадрат с <tex>n-k</tex> степенями свободы. |
- | <tex>\chi_{\alpha}</tex> есть <tex>\alpha</tex>-[[квантиль]] | + | |
- | распределения хи-квадрат с <tex>n-k</tex> степенями свободы. | + | |
==Доверительный интервал для прогнозного значения отклика== | ==Доверительный интервал для прогнозного значения отклика== | ||
*Как и в случае построения доверительного интервала для коэффициентов регрессии, воспользуемся свойством, что величина | *Как и в случае построения доверительного интервала для коэффициентов регрессии, воспользуемся свойством, что величина | ||
- | ::<tex>\frac{c^T(\hat\theta-\theta)}{\hat\sigma\sqrt{c^T(X^TX)^{-1}c}} | + | ::<tex>\frac{c^T(\hat\theta-\theta)}{\hat\sigma\sqrt{c^T(X^TX)^{-1}c}}\sim t_{n-k}</tex> :имеет [[распределение Стьюдента]] с |
- | \sim t_{n-k}</tex> :имеет [[распределение Стьюдента]] с | + | |
<tex>n-k</tex> степенями свободы. | <tex>n-k</tex> степенями свободы. | ||
*Пусть <tex>x_0 = (x_{01}\cdots x_{0k})</tex> - новый объект в регрессионной модели, положим <tex>c=x_0.</tex> | *Пусть <tex>x_0 = (x_{01}\cdots x_{0k})</tex> - новый объект в регрессионной модели, положим <tex>c=x_0.</tex> | ||
*Тогда доверительный интервал для значения отклика <tex>y(x_0)</tex> с доверительной вероятностью <tex>1-\alpha</tex> будеи иметь вид: | *Тогда доверительный интервал для значения отклика <tex>y(x_0)</tex> с доверительной вероятностью <tex>1-\alpha</tex> будеи иметь вид: | ||
- | ::<tex> x_0^T\hat\theta-\Delta y_0 \leq y(x_0) \leq | + | ::<tex> x_0^T\hat\theta-\Delta y_0 \leq y(x_0) \leq x_0^T\hat\theta+\Delta y_0, \;</tex> |
- | x_0^T\hat\theta+\Delta y_0, \;</tex> где ::<tex>x_0^T\hat\theta = | + | где |
- | \hat y_0;</tex> ::<tex>\Delta y_0 = | + | ::<tex>x_0^T\hat\theta = \hat y_0;</tex> |
- | t_{n-k,1-\frac{\alpha}2}\hat\sigma\sqrt{x_0^T(X^TX)^{-1}x_0} | + | ::<tex>\Delta y_0 = t_{n-k,1-\frac{\alpha}2}\hat\sigma\sqrt{x_0^T(X^TX)^{-1}x_0},\; t_{\alpha}</tex> есть <tex>\alpha</tex>-[[квантиль]] распределения Стьюдента с <tex>n-k</tex> степенями свободы. |
+ | |||
+ | ==Литература== | ||
+ | # ''Кобзарь А. И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. | ||
+ | # ''Магнус Я. Р., Катышев П. К., Пересецкий А. А.'' Эконометрика. Начальный курс: Учеб. — 7-е изд., испр. — М.: Дело, 2005. | ||
+ | |||
+ | ==См. также== | ||
+ | * [[Многомерная линейная регрессия]] | ||
+ | * [[Метод наименьших квадратов]] | ||
+ | * [[Статистические свойства МНК-оценок коэффициентов регрессии]] | ||
+ | |||
+ | ==Ссылки== | ||
+ | |||
+ | [[Категория:Прикладная статистика]] | ||
+ | [[Категория:Регрессионный анализ]] |
Текущая версия
После того как были изучены статистические свойства МНК-оценок коэффициентов регрессии, можно переходить к построению доверительных интервалов для коэффициентов регрессии, дисперсии шума, а также прогнозного значения отклика.
Содержание |
Доверительный интервал для коэффициентов регрессии
- Работаем в предположениях, что выполнены ОП1, ОП2 и ДП3. Тогда можем воспользовать тем свойством, что величина
- имеет распределение Стьюдента с степенями свободы.
- Далее, если взять (т.е. произведение выделяет -ю компоненту вектора ), то получим
- где есть -квантиль распределения Стьюдента с степенями свободы.
- Тогда двусторонний доверительный интервал с доверительной вероятностью для коэффициента регрессии будет иметь вид:
Доверительный интервал для дисперсии шума
- Регрессионные остатки (шум) имеют нормальное распределние . Для анализа неизвестной дисперсии шума может быть использовано свойство, что случайная величина
- распределена по закону хи-квадрат с степенями свободы.
- Тогда доверительный интервал с доверительной вероятностью для дисперсии шума равен:
- где есть -квантиль распределения хи-квадрат с степенями свободы.
Доверительный интервал для прогнозного значения отклика
- Как и в случае построения доверительного интервала для коэффициентов регрессии, воспользуемся свойством, что величина
- :имеет распределение Стьюдента с
степенями свободы.
- Пусть - новый объект в регрессионной модели, положим
- Тогда доверительный интервал для значения отклика с доверительной вероятностью будеи иметь вид:
где
- есть -квантиль распределения Стьюдента с степенями свободы.
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
- Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс: Учеб. — 7-е изд., испр. — М.: Дело, 2005.
См. также
- Многомерная линейная регрессия
- Метод наименьших квадратов
- Статистические свойства МНК-оценок коэффициентов регрессии