Коэффициент детерминации
Материал из MachineLearning.
В статистике коэффициентом детерминации, , называется величина, показывающая, какая доля дисперсии выборки определяется параметрами выбранной модели.
Определение
Существует несколько альтернативных определений коэффициента детерминации, однако в случае линейной регрессии все они эквивалентны: тогда равен квадрату коэффициента корреляции.
Пусть выборка имеет значения , и ей соответствуют модельные данные ; и - средние значения наблюдаемых и модельных данных. Тогда введем следующие обозначения:
общая сумма квадратов отклонения (пропорциональная дисперсии);
регрессионная сумма квадратов отклонений (объяснимая моделью);
, сумма квадратов ошибок.
Общее определение коэффициента детерминированности:
Дробь показывает отношение не объясненных моделью вариаций к общим вариациям, так что введенное таким образом определение ясно отражает суть понятия коэффициент детерминации.
Интерпретация
содержит информацию о том, насколько хорошо модель подходит под исходные данные. Например, в случае решения задачи регрессии коэффициент детерминации покажет, насколько график модельных значений совпадает с графиком наблюдаемых значений: если , то эти графики совпадают. Однако само по себе значение коэффициента детерминированности не может свидетельствовать о том, что модель выбрана правильно.