Анализ регрессионных остатков
Материал из MachineLearning.
(→См. также) |
|||
(5 промежуточных версий не показаны.) | |||
Строка 1: | Строка 1: | ||
Для получения информации об адекватности построеной модели [[Многомерная линейная регрессия|многомерной линейной регрессии]] исследуют [[Многомерная линейная регрессия|регрессионные остатки]]. Если выбранная регрессионная модель хорошо описывает истинную зависимость, | Для получения информации об адекватности построеной модели [[Многомерная линейная регрессия|многомерной линейной регрессии]] исследуют [[Многомерная линейная регрессия|регрессионные остатки]]. Если выбранная регрессионная модель хорошо описывает истинную зависимость, | ||
то остатки должны быть [[Выборка|независимыми]] [[Нормальное распределение|нормально распределенными]] [[Многомерная случайная величина|случайными величинами]] с нулевым [[Многомерная случайная величина|средним]], | то остатки должны быть [[Выборка|независимыми]] [[Нормальное распределение|нормально распределенными]] [[Многомерная случайная величина|случайными величинами]] с нулевым [[Многомерная случайная величина|средним]], | ||
- | и в их значениях должен отсутствовать [[тренд]]. '''Анализ регрессионных остатков''' - это процесс проверки выполнения этих условий. | + | и в их значениях должен отсутствовать [[тренд]]. '''Анализ регрессионных остатков''' - это процесс проверки выполнения этих условий. Пример проверки см. в статье «[[Анализ регрессионных остатков (пример)]]». |
==Обозначения== | ==Обозначения== | ||
Строка 13: | Строка 13: | ||
Для того, чтобы регрессионная модель хорошо описывала истинные данные, регрессионные остатки <tex>\varepsilon_i (i= 1,\dots,n)</tex> должны обладать следующими свойствами: | Для того, чтобы регрессионная модель хорошо описывала истинные данные, регрессионные остатки <tex>\varepsilon_i (i= 1,\dots,n)</tex> должны обладать следующими свойствами: | ||
*<tex> E \varepsilon_i = 0,i= 1,\dots,n</tex>{{eqno|1}} | *<tex> E \varepsilon_i = 0,i= 1,\dots,n</tex>{{eqno|1}} | ||
- | Эту гипотезу можно проверять | + | Эту гипотезу можно проверять любым [[Проверка статистических гипотез|параметрическим]] или [[Проверка статистических гипотез|непараметрическим критерием]] сравнения среднего с заданным значением( в данном случае - с нулём). |
- | *<tex> D \varepsilon_i = \sigma^2,i= 1,\dots,n</tex>{{eqno|2}} - т.е. дисперсия | + | *<tex> D \varepsilon_i = \sigma^2,i= 1,\dots,n</tex>{{eqno|2}} - т.е. одинаковая дисперсия. |
Проверяется аналогично, любым [[Проверка статистических гипотез|параметрическим]] или [[Проверка статистических гипотез|непараметрическим критерием]] сравнения дисперсии с заданным значением. Например, [[Критерий Зигеля-Тьюки]]. | Проверяется аналогично, любым [[Проверка статистических гипотез|параметрическим]] или [[Проверка статистических гипотез|непараметрическим критерием]] сравнения дисперсии с заданным значением. Например, [[Критерий Зигеля-Тьюки]]. | ||
*<tex> \varepsilon_i \sim N(0,\sigma) i= 1,\dots,n, i \neq j</tex> {{eqno|3}} | *<tex> \varepsilon_i \sim N(0,\sigma) i= 1,\dots,n, i \neq j</tex> {{eqno|3}} | ||
- | Это дополнительное предположение. Его важно проверить, если мы хотим использовать статистический критерий, предполагающий нормальность данных. Для проверки этой гипотезы можно использовать [[Статистический критерий|Критерий нормальности]]. | + | Это дополнительное предположение. Его важно проверить, если для проверки других свойств регрессионных остатков мы хотим использовать статистический критерий, предполагающий нормальность данных. Для проверки этой гипотезы можно использовать [[Статистический критерий|Критерий нормальности]]. |
*<tex> \varepsilon_i i= 1,\dots,n</tex>{{eqno|4}} - независимы. | *<tex> \varepsilon_i i= 1,\dots,n</tex>{{eqno|4}} - независимы. | ||
Строка 45: | Строка 45: | ||
Эта гипотеза - объединяет {{eqref|2}},{{eqref|4}}. Если выполнено {{eqref|1}}, то стационарность удобно проверять с помощью [[Критерий Вальда-Вольфовица|критерия серий]]. | Эта гипотеза - объединяет {{eqref|2}},{{eqref|4}}. Если выполнено {{eqref|1}}, то стационарность удобно проверять с помощью [[Критерий Вальда-Вольфовица|критерия серий]]. | ||
+ | |||
==Литература== | ==Литература== | ||
#''Кобзарь А. И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с. (стр. 658-659) | #''Кобзарь А. И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с. (стр. 658-659) | ||
==См. также== | ==См. также== | ||
+ | * [[Регрессионный анализ]] | ||
+ | * [[Регрессионная модель]] | ||
+ | * [[Анализ регрессионных остатков (пример)]] | ||
+ | * [[Статистика Дарбина-Уотсона]] | ||
==Ссылки== | ==Ссылки== | ||
Строка 53: | Строка 58: | ||
[[Категория:Прикладная статистика]] | [[Категория:Прикладная статистика]] | ||
[[Категория:Регрессионный анализ]] | [[Категория:Регрессионный анализ]] | ||
- | {{ | + | |
+ | {{Задание|Василий Ломакин|Vokov|31 декабря 2009}} |
Текущая версия
Для получения информации об адекватности построеной модели многомерной линейной регрессии исследуют регрессионные остатки. Если выбранная регрессионная модель хорошо описывает истинную зависимость, то остатки должны быть независимыми нормально распределенными случайными величинами с нулевым средним, и в их значениях должен отсутствовать тренд. Анализ регрессионных остатков - это процесс проверки выполнения этих условий. Пример проверки см. в статье «Анализ регрессионных остатков (пример)».
Содержание |
Обозначения
Пусть дана последовательность наблюдаемых величин и получены их оценки:
Регрессионные остатки обозначим через , .
Свойства регрессионных остатков
Для того, чтобы регрессионная модель хорошо описывала истинные данные, регрессионные остатки должны обладать следующими свойствами:
- (1)
Эту гипотезу можно проверять любым параметрическим или непараметрическим критерием сравнения среднего с заданным значением( в данном случае - с нулём).
- (2)- т.е. одинаковая дисперсия.
Проверяется аналогично, любым параметрическим или непараметрическим критерием сравнения дисперсии с заданным значением. Например, Критерий Зигеля-Тьюки.
- (3)
Это дополнительное предположение. Его важно проверить, если для проверки других свойств регрессионных остатков мы хотим использовать статистический критерий, предполагающий нормальность данных. Для проверки этой гипотезы можно использовать Критерий нормальности.
- (4)- независимы.
Независимость остатков может быть проверена при помощи статистики Дарбина-Уотсона.
- (6)
- .
Для проверки этих условий используется визуальный анализ. Зависимость не должна иметь закономерностей, где .
- Гипотеза случайности
- Гипотеза отсутствия тренда (8)
Отсутствие тренда удобно проверять с помощью U-критерия. Также можно применить визуальный анализ.
- Гипотеза стационарности
Эта гипотеза - объединяет (2),(4). Если выполнено (1), то стационарность удобно проверять с помощью критерия серий.
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с. (стр. 658-659)
См. также
- Регрессионный анализ
- Регрессионная модель
- Анализ регрессионных остатков (пример)
- Статистика Дарбина-Уотсона
Ссылки
Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |