Значимость коэффициентов линейной регрессии
Материал из MachineLearning.
Валентина Федорова (Обсуждение | вклад)
(Новая: Проверка статистической '''значимости коэффициентов линейной регрессии''' заключается в проверке [[Ну...)
К следующему изменению →
Версия 17:15, 23 января 2009
Проверка статистической значимости коэффициентов линейной регрессии заключается в проверке гипотезы значимости или незначимости отличия оценок некоторых регрессионных коэффициентов от нуля. Если в результате проверки оказывается, что отличие оценки каких-то регрессионных коэффициентов от нуля не влияет на качество модели, то соответствующие предикторные переменные можно искличить из регрессионной модели.
Содержание |
Обозначения
Введем обозначения:
- - набор предикторных переменных
- - коэффициенты линейной регрессии.
- – зависимая переменная (отклик)
Модель линейной регрессии имеет вид:
Пусть .Введём дополнительные обозначения:
Тогда .
Тогда .
Анализ структкры модели
Утверждение 1:
Если основные предположения многомерной линейной регрессии верны для , но МНК-оценка построена только по , то - смещённая и несостоятельная оценка для .
Утверждение 1 говорит о том, что если при построении модели регрессии мы недобрали признаков(предикторных переменных), то получим плохую МНК-оценку для параметров регрессии.
Утверждение 2:
Если основные предположения многомерной линейной регрессии верны для , но МНК-оценка построена по , то - несмещённая и состоятельная оценка для .
При этом .
В утверждении 2 говорится, что если в регрессионной модели присутствуют лишние признаки, то возрастают дисперсии полученных МНК-оценок.
Можно сделать вывод, что если не выполнять проверок на значимость предикторных переменных, то для получения хорошей МНК-оценки коэффициентов регрессии лучше взять предикторных переменных больше, нежели недобрать их.
Проверка значимости коэффициентов
Коэффициент линейной регрессии считается значимым, если его МНК-оценка отлична от нуля.
Опишем критерий Фишера проверки значимости коэффициентов линейной регрессии.
Нулевая гипотеза .
Нулевая гипотеза утверждает, что отклик не зависит от предикторных переменных .
Статистика критерия:
имеет имеет распределение Фишера с и степенями свободы. Тогда критической областью критерия является правый хвост распределения Фишера, что соотвествует альтернативной гипотезе .
Критерий (при уровне значимости ) против альтернативы :
- если , то нулевая гипотеза отвергается в пользу альтернативы ;
- если , то принимаем нулевую гипотезу ;
где есть -квантиль распределения Фишера с и степенями свободы.
Литература
- Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. — М.: Дело, 2004. — 576 с. стр.124-132
См. также
Ссылки
Статья в настоящий момент дорабатывается. Валентина Федорова 20:15, 23 января 2009 (MSK) |