Корреляция Мэтьюса
Материал из MachineLearning.
Ekaterina (Обсуждение | вклад)
(Новая: Корреляция Мэтьюса используется в машинном обучении как мера качества для бинарной классификации. О...)
К следующему изменению →
Версия 23:30, 2 декабря 2013
Корреляция Мэтьюса используется в машинном обучении как мера качества для бинарной классификации. Она может быть использована, если размеры классов сильно различаются. Принимает значение [-1, 1]. Результат 1 соответствует идеальному предсказанию, 0 - ситуации случайного предсказания, -1 - полностью противоположному предсказанию. В литературе так же известна как -коэффициент.
Пусть - бинарный вектор, соответствующий истинной классификации, а - предсказание некоторого алгоритма. Обозначим за отрицание бинарного вектора. Составим следующую таблицу, в ячейках которой расположено скалярное произведение векторов.
TP | FN | |
FP | TN |
Это соответвует классическому представлению true positive, false negative, false positive, true negative в результатах классификации.
Тогда корреляция Мэтьюса определяется следующей формулой:
.
Можно записать формулу в более удобном виде, если ввести ряд обозначений.
Корреляция Мэтьюса связана со статистикой хи-квадрат:
Пример: пусть истинный вектор классификации [0, 0, 1, 1, 1], а предсказанный некоторым алгоритмом [1, 0, 1, 1, 0]. Тогда .
Первый раз иформация появилась в статье "Comparison of the predicted and observed secondary structure of T4 phage lysozyme" в журнале "Biochim. Biophys. Acta 1975" , автор Matthews.
Источник: Assessing the accuracy of prediction algorithms for classification: an overview.