Коэффициент корреляции Спирмена

Материал из MachineLearning.

Версия от 13:10, 11 ноября 2008; Tsurko Varvara (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

Содержание

Заданы две выборки x = (x_1,\ldots,x_n),\;\; y = (y_1,\ldots,y_n).

Обозначим через L_x — число связок в выборке x;

T_{x_l} — число объектов в l-ой связке, l=1,\ldots,L_x;
L_y — число связок в выборке y;
T_{y_l} — число объектов в l-ой связке, l=1,\ldots,L_y;

Выборкам x и y соответствуют последовательности рангов:

R_x=(R_{x_1},\ldots,R_{x_n}), где R_{x_i} — ранг i-го объекта в вариационном ряду выборки x;
R_y=(R_{y_1},\ldots,R_{y_n}), где R_{y_i} — ранг i-го объекта в вариационном ряду выборки y.

Коэффициент корреляции Спирмена равен

\rho=\frac{\sum_{i=1}^n{(R_{x_i}-\frac{n+1}{2})(R_{y_i}-\frac{n+1}{2})}}{\frac{1}{12}(n^3-n)-\Delta},

где \Delta=\frac{1}{2}\sum_{l=1}^{L_{x}}{T_{x_l}(T_{x_l}^2-1)+\frac{1}{2}\sum_{l=1}^{L_y}{T_{y_l}(T_{y_l}^2-1)}}

Связь коэффициента корреляции Спирмена с коэффициентом корреляции Пирсона

В случае выборок из нормального распределения коэффициент корреляции Спирмена \rho может быть использован для оценки коэффициента корреляции Пирсона r по формуле

r=sin{\frac{\pi\rho}{2}}


Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.


Статья в настоящий момент дорабатывается.
Участник:Tsurko Varvara 16:00, 11 ноября 2008 (MSK)



Личные инструменты