Коэффициент корреляции Кенделла

Материал из MachineLearning.

Версия от 22:11, 5 ноября 2008; Tsurko Varvara (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

Заданы две выборки x = (x_1,\ldots,x_n),\;\; y = (y_1,\ldots,y_n).

Коэффициент корреляции, предложенный Кендаллом равен

\tau_{xy}=1-\frac{4}{n(n-1)}\sum_{i=1}^{n-1}\sum_{j=i+1}^n\left[[x_i<x_j]\neq[y_i<y_j]\right],

где [логическое выражение]=1, если логическое выражение верно, иначе 0, например, [x_i<x_j]=\left\{ \begin{array}{l} 1, x_i>x_j;\\     0, x_i \geq x_j.\\ \end{array} \right

Гипотеза H_0: Выборки x и y независимы.

Статистика критерия:

\frac{\tau_{xy}}{\sqrt{D_{\tau_{xy}}}},

где D_{\tau_{xy}}=\frac{2(2n+5)}{9n(n-1)}.

При n\geq 10 статистику критерия можно приблизить нормальным распределением с параметрами (0,1):

\frac{\tau_{xy}}{\sqrt{D_{\tau_{xy}}}}\sim N(0,1)

Критерий (при уровне значимости \alpha):

  • против альтернативы H_1: выборки зависимы, есть монотонная связь
если |\tau_{xy}| > \tau_{\alpha}=u_{\alpha}\cdot\sqrt{D_{\tau_{xy}}} , где u_{\alpha}\alpha-квантиль стандартного нормального распределения.

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
Личные инструменты