Коэффициент детерминации
Материал из MachineLearning.
(Новая: В статистике '''коэффициентом детерминации''', <tex>R^2</tex>, называется величина, показывающа...) |
|||
Строка 1: | Строка 1: | ||
- | + | '''Коэффициентом детерминации''', <tex>R^2</tex>, называется величина, показывающая, какая доля [[дисперсия|дисперсии]] выборки определяется параметрами выбранной модели. | |
== Определение == | == Определение == | ||
- | Существует несколько альтернативных определений '''коэффициента детерминации''', однако в случае [[ | + | Существует несколько альтернативных определений '''коэффициента детерминации''', однако в случае [[Регрессионный анализ|линейной регрессии]] все они эквивалентны: <tex>R^2</tex> тогда равен квадрату [[коэффициент корреляции|коэффициента корреляции]]. |
Пусть выборка имеет значения <tex>y_i</tex>, и ей соответствуют модельные данные <tex>f_i</tex>; <tex>\bar{y}</tex> и <tex>\bar{f}</tex> - средние значения наблюдаемых и модельных данных. Тогда введем следующие обозначения: | Пусть выборка имеет значения <tex>y_i</tex>, и ей соответствуют модельные данные <tex>f_i</tex>; <tex>\bar{y}</tex> и <tex>\bar{f}</tex> - средние значения наблюдаемых и модельных данных. Тогда введем следующие обозначения: | ||
- | <tex>SS_{\rm tot}=\sum_i (y_i-\bar{y})^2,</tex> общая сумма квадратов отклонения (пропорциональная | + | <tex>SS_{\rm tot}=\sum_i (y_i-\bar{y})^2,</tex> общая сумма квадратов отклонения (пропорциональная дисперсии); |
<tex>SS_{\rm reg}=\sum_i ({f_i}-\bar{f})^2,</tex> регрессионная сумма квадратов отклонений (объяснимая моделью); | <tex>SS_{\rm reg}=\sum_i ({f_i}-\bar{f})^2,</tex> регрессионная сумма квадратов отклонений (объяснимая моделью); | ||
Строка 27: | Строка 27: | ||
* [http://en.wikipedia.org/wiki/Coefficient_of_determination Wikipedia] | * [http://en.wikipedia.org/wiki/Coefficient_of_determination Wikipedia] | ||
- | [[Категория: | + | [[Категория: Регрессионный анализ]] |
Версия 18:09, 26 апреля 2009
Коэффициентом детерминации, , называется величина, показывающая, какая доля дисперсии выборки определяется параметрами выбранной модели.
Определение
Существует несколько альтернативных определений коэффициента детерминации, однако в случае линейной регрессии все они эквивалентны: тогда равен квадрату коэффициента корреляции.
Пусть выборка имеет значения , и ей соответствуют модельные данные ; и - средние значения наблюдаемых и модельных данных. Тогда введем следующие обозначения:
общая сумма квадратов отклонения (пропорциональная дисперсии);
регрессионная сумма квадратов отклонений (объяснимая моделью);
, сумма квадратов ошибок.
Общее определение коэффициента детерминированности:
Дробь показывает отношение не объясненных моделью вариаций к общим вариациям, так что введенное таким образом определение ясно отражает суть понятия коэффициент детерминации.
Интерпретация
содержит информацию о том, насколько хорошо модель подходит под исходные данные. Например, в случае решения задачи регрессии коэффициент детерминации покажет, насколько график модельных значений совпадает с графиком наблюдаемых значений: если , то эти графики совпадают. Однако само по себе значение коэффициента детерминированности не может свидетельствовать о том, что модель выбрана правильно.