Дисперсия остатков
Материал из MachineLearning.
(Различия между версиями)
(Новая: Качество модели линейной регрессии связано с адекватностью (соотв...) |
|||
Строка 3: | Строка 3: | ||
==Описание метода== | ==Описание метода== | ||
- | Основными показателями качества линейной регрессионной модели являются | + | Основными показателями качества линейной регрессионной модели являются: |
* Среднеквадратичная ошибка уравнения регрессии <tex>S^2,</tex> равная | * Среднеквадратичная ошибка уравнения регрессии <tex>S^2,</tex> равная | ||
Строка 11: | Строка 11: | ||
::<tex>\sigma^2 = \frac{\sum\limits_{i=1}^n(y_i - \bar y)}{n-1}, \;\;</tex> где <tex>\bar y = \frac1n \sum\limits_{i=1}^n y_i.</tex> | ::<tex>\sigma^2 = \frac{\sum\limits_{i=1}^n(y_i - \bar y)}{n-1}, \;\;</tex> где <tex>\bar y = \frac1n \sum\limits_{i=1}^n y_i.</tex> | ||
- | + | ||
+ | Для оценки дисперсии шума <tex>\sigma^2</tex> предварительно проводится серия наблюдений над [[многомерная случайная величина|случайной величиной]] <tex>y</tex> при фиксированной величине <tex>x</tex>. В итоге получаем выборку <tex>\tilde y = (\tilde y_1, \cdots, \tilde y_m),</tex> где <tex>m</tex> - число наблюдений. Тогда | ||
::<tex> \sigma^2 = \frac{\sum\limits_{i=1}^n(\tilde y_i - \bar{\tilde y})}{n-1}, \;\;</tex> где <tex>\bar{\tilde y} = \frac1n \sum\limits_{i=1}^n \tilde y_i.</tex> | ::<tex> \sigma^2 = \frac{\sum\limits_{i=1}^n(\tilde y_i - \bar{\tilde y})}{n-1}, \;\;</tex> где <tex>\bar{\tilde y} = \frac1n \sum\limits_{i=1}^n \tilde y_i.</tex> | ||
Версия 02:19, 30 января 2009
Качество модели линейной регрессии связано с адекватностью (соответствием) модели наблюдаемым данным. Проверка адекватности модели регрессии проводится на основе анализа регрессионных остатков, в частности, на основе анализа дисперсии остатков.
Содержание |
Описание метода
Основными показателями качества линейной регрессионной модели являются:
- Среднеквадратичная ошибка уравнения регрессии равная
- где - остаточная сумма квадратов.
- Среднеквадратичное отклонение результата
- где
Для оценки дисперсии шума предварительно проводится серия наблюдений над случайной величиной при фиксированной величине . В итоге получаем выборку где - число наблюдений. Тогда
- где
- В качестве статистики критерия берется отношение
- которое имеет распределение Фишера с и степенями свободы.
- Если где - -квантиль распределения Фишера, то ошибка в модели регрессии признается статистически значимой.
- В противном случае модель признается адекватной и дисперсию можно использовать в качестве несмещенной оценки для
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.