Участник:Василий Ломакин/Коэффициент корреляции Спирмена
Материал из MachineLearning.
Василий Ломакин (Обсуждение | вклад)
(Новая: {{TOCright}} ==Определение== Заданы две выборки <tex>x = (x_1,\ldots,x_n),\;\; y = (y_1,\ldots,y_n)</tex>. Обозначим через <tex>L_x</tex> — ...)
К следующему изменению →
Версия 16:25, 3 января 2010
|
Определение
Заданы две выборки .
Обозначим через — число связок в выборке ;
- — число объектов в -ой связке, ;
- — число связок в выборке ;
- — число объектов в -ой связке, ;
Выборкам и соответствуют последовательности рангов:
- , где — ранг -го объекта в вариационном ряду выборки ;
- , где — ранг -го объекта в вариационном ряду выборки .
Коэффициент корреляции Спирмена равен
где
Коэффициент корреляции Спирмена изменяется от -1 до 1. Равенство указывает на строгую линейную корреляцию, указывает на отсутствие корреляции.
Статистическая проверка наличия корреляции
Гипотеза : Выборки и не коррелируют, .
Статистика критерия:
- ,
где — распределение Стьюдента с степенями свободы.
Критерий (при уровне значимости ):
- против альтернативы : наличие корреляции
- если , где — -квантиль распределение Стьюдента с степенями свободы..
Связь коэффициента корреляции Спирмена с коэффициентом корреляции Пирсона
В случае выборок из нормального распределения коэффициент корреляции Спирмена может быть использован для оценки коэффициента корреляции Пирсона по формуле
Связь коэффициента корреляции Спирмена с коэффициентом корреляциии Кенделла
Выборкам и соответствуют последовательности рангов:
- , где — ранг -го объекта в вариационном ряду выборки ;
- , где — ранг -го объекта в вариационном ряду выборки .
Проведем операцию упорядочевания рангов.
Расположим ряд значений в порядке возрастания величины: . Тогда последовательность рангов упорядоченной выборки будет представлять собой последовательность натуральных чисел . Значения , соответствующие значениям , образуют в этом случае некоторую последовательность рангов .
- ( — операция упорядочевания рангов).
Коэффициент корреляции Спирмена и коэффициент корреляции Кенделла выражаются через ранги следующим образом:
Коэффициент корреляции Спирмена учитывает насколько сильна неупорядоченность.
Утверждение. Если выборки и не коррелируют (выполняется гипотеза ), то коэффициент корреляции между величинами и можно вычислить по формуле:
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
- Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003
См. также
Ссылки
- Коэффициент корреляции(Википедия)
- Корреляционный анализ (Википедия)