Корреляция Мэтьюса
Материал из MachineLearning.
Корреляция Мэтьюса используется в машинном обучении как мера качества для бинарной классификации. Она может быть использована, если размеры классов сильно различаются. Принимает значение [-1, 1]. Результат 1 соответствует идеальному предсказанию, 0 - ситуации случайного предсказания, -1 - полностью противоположному предсказанию. В литературе так же известна как -коэффициент.
Содержание |
Определение
Пусть - бинарный вектор, соответствующий истинной классификации, а - предсказание некоторого алгоритма. Обозначим за отрицание бинарного вектора. Составим следующую таблицу, в ячейках которой расположено скалярное произведение векторов.
TP | FN | |
FP | TN |
Это соответвует классическому представлению true positive, false negative, false positive, true negative в результатах классификации [1].
Тогда корреляция Мэтьюса определяется следующей формулой:
.
Можно записать формулу в более удобном виде, если ввести ряд обозначений.
Связь с хи-квадрат
Корреляция Мэтьюса связана со статистикой хи-квадрат:
Пример
Пусть истинный вектор классификации [0, 0, 1, 1, 1], а предсказанный некоторым алгоритмом [1, 0, 1, 1, 0]. Тогда .
Источники
Первый раз иформация появилась в статье "Comparison of the predicted and observed secondary structure of T4 phage lysozyme" в журнале "Biochim. Biophys. Acta 1975" , автор Matthews.
Определение: Assessing the accuracy of prediction algorithms for classification: an overview.