Статистические свойства МНК-оценок коэффициентов регрессии
Материал из MachineLearning.
(1 промежуточная версия не показана) | |||
Строка 1: | Строка 1: | ||
- | Статистическое исследование [[многомерная линейная регрессия|линейной регрессии]] включает в себя построение [[ | + | Статистическое исследование [[многомерная линейная регрессия|линейной регрессии]] включает в себя построение [[доверительные интервалы для параметров регрессии|доверительных интервалов для параметров регрессии]]. Однако прежде чем переходить к решению поставленной задачи, необходимо выяснить, какими '''статистическими свойствами''' обладают '''[[Метод наименьших квадратов|МНК-оценки]] коэффициентов регрессии.''' |
- | + | ||
- | Однако прежде чем переходить к решению поставленной задачи, необходимо выяснить, какими '''статистическими свойствами''' обладают '''[[Метод наименьших квадратов|МНК-оценки]] коэффициентов регрессии.''' | + | |
==Основные обозначения== | ==Основные обозначения== | ||
Строка 82: | Строка 80: | ||
==Литература== | ==Литература== | ||
+ | # ''Лагутин М. Б.'' Наглядная математическая статистика. — М.: Бином, 2007. | ||
# ''Кобзарь А. И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. | # ''Кобзарь А. И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. | ||
# ''Магнус Я. Р., Катышев П. К., Пересецкий А. А.'' Эконометрика. Начальный курс: Учеб. — 7-е изд., испр. — М.: Дело, 2005. | # ''Магнус Я. Р., Катышев П. К., Пересецкий А. А.'' Эконометрика. Начальный курс: Учеб. — 7-е изд., испр. — М.: Дело, 2005. | ||
Строка 88: | Строка 87: | ||
* [[Многомерная линейная регрессия]] | * [[Многомерная линейная регрессия]] | ||
* [[Метод наименьших квадратов]] | * [[Метод наименьших квадратов]] | ||
- | * [[Доверительные интервалы | + | * [[Доверительные интервалы для параметров регрессии]] |
==Ссылки== | ==Ссылки== |
Текущая версия
Статистическое исследование линейной регрессии включает в себя построение доверительных интервалов для параметров регрессии. Однако прежде чем переходить к решению поставленной задачи, необходимо выяснить, какими статистическими свойствами обладают МНК-оценки коэффициентов регрессии.
Содержание |
Основные обозначения
Ввдедем матричные обозначения:
- - матрица, столбцами которой являются векторы признаков (регрессоров), а строками - объекты;
- – зависимая переменная (отклик);
- - коэффициенты линейной регрессии;
Модель линейной регрессии имеет вид:
- - вектор регрессионных остатков;
- - МНК-оценка коэффициентов регрессии.
Основные Предположения
Для того, чтобы МНК-оценки коэффициентов регрессии обладали хорошими свойствами, необходимо выполнение ряда предпосылок, называемых Основными Предположениями.
- ОП1: - детерминированная матрица, (признаки линейно-независимы);
- ОП2: Регрессионные остатки
- 2.1. одинаково распределены;
- 2.2. (модель несмещенная);
- 2.3. (гомоскедастичность);
- 2.4. (некореллированность).
- Дополнительное Предположение 3 (ДП3): ,
- т.е вектор регрессионных остатков - нормально распределенный случайный вектор со средним 0 и матрицей ковариации ( - единичная матрица размера ). В этом случаем модель называется нормальной линейной регрессионной моделью.
Проверки этих предположений занимается Анализ регрессионных остатков.
Свойства МНК-оценок без предположения о нормальности
Теорема Гаусса-Маркова. Пусть выполнены ОП1 и ОП2. Тогда оценка полученная по методу наименьших квадратов является эффективной в классе линейных несмещенных оценок (Best Linear Unbiased Estimator, BLUE).
Исходя из этой теоремы можно выделить несколько основных свойств МНК-оценки
- Линейность:
- где
- Несмещенность:
- Матрица ковариации равна:
- МНК-оценка эффективна.
Итак, теорема Гаусса-Маркова утверждает, что любая другая линейная несмещенная оценка будет иметь большую дисперсию, чем МНК-оценка:
Нетрудно показать, что для любого вектора оценка будет обладать теми же свойствами, что и МНК-оценка . Поэтому:
- если взять то получим что
- - несмещенная, эффективная оценка
- если то
- - несмещенная, эффективная оценка
Свойства МНК-оценок с предположением о нормальности
Пусть теперь к тому же выполнено ДП3, т.е. - многомерная нормально распределенная случайная величина, или, что то же самое имеют совместное нормальное распределение. Тогда к перечисленным выше свойствам добавятся следующие:
- МНК-оценка коэффициентов регрессии имеет нормальное распределение:
- Несмещенная оценка для дисперсии шума имеет вид:
- где RSS есть остаточная сумма квадратов;
- Случайная величина
- распределена по закону хи-квадрат с степенями свободы;
- Оценки и линейно независимы. Откуда получается, что величина
- имеет распределение Стьюдента с степенями свободы.
- А значит величина
- также имеет распределение Стьюдента с степенями свободы.
Литература
- Лагутин М. Б. Наглядная математическая статистика. — М.: Бином, 2007.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
- Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс: Учеб. — 7-е изд., испр. — М.: Дело, 2005.
См. также
- Многомерная линейная регрессия
- Метод наименьших квадратов
- Доверительные интервалы для параметров регрессии