Коэффициент корреляции Кенделла

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: Заданы две выборки <tex>x = (x_1,\ldots,x_n),\;\; y = (y_1,\ldots,y_n)</tex>. '''Коэффициент корреляции''', предложенный Кенда...)
Строка 1: Строка 1:
Заданы две выборки <tex>x = (x_1,\ldots,x_n),\;\; y = (y_1,\ldots,y_n)</tex>.
Заданы две выборки <tex>x = (x_1,\ldots,x_n),\;\; y = (y_1,\ldots,y_n)</tex>.
-
'''[[Коэффициент корреляции]]''', предложенный Кендаллом равен
+
'''[[Коэффициент корреляции]]''', предложенный Кенделлом равен
:: <tex>\tau_{xy}=1-\frac{4}{n(n-1)}\sum_{i=1}^{n-1}\sum_{j=i+1}^n\left[[x_i<x_j]\neq[y_i<y_j]\right]</tex>,
:: <tex>\tau_{xy}=1-\frac{4}{n(n-1)}\sum_{i=1}^{n-1}\sum_{j=i+1}^n\left[[x_i<x_j]\neq[y_i<y_j]\right]</tex>,

Версия 22:12, 5 ноября 2008

Заданы две выборки x = (x_1,\ldots,x_n),\;\; y = (y_1,\ldots,y_n).

Коэффициент корреляции, предложенный Кенделлом равен

\tau_{xy}=1-\frac{4}{n(n-1)}\sum_{i=1}^{n-1}\sum_{j=i+1}^n\left[[x_i<x_j]\neq[y_i<y_j]\right],

где [логическое выражение]=1, если логическое выражение верно, иначе 0, например, [x_i<x_j]=\left\{ \begin{array}{l} 1, x_i>x_j;\\     0, x_i \geq x_j.\\ \end{array} \right

Гипотеза H_0: Выборки x и y независимы.

Статистика критерия:

\frac{\tau_{xy}}{\sqrt{D_{\tau_{xy}}}},

где D_{\tau_{xy}}=\frac{2(2n+5)}{9n(n-1)}.

При n\geq 10 статистику критерия можно приблизить нормальным распределением с параметрами (0,1):

\frac{\tau_{xy}}{\sqrt{D_{\tau_{xy}}}}\sim N(0,1)

Критерий (при уровне значимости \alpha):

  • против альтернативы H_1: выборки зависимы, есть монотонная связь
если |\tau_{xy}| > \tau_{\alpha}=u_{\alpha}\cdot\sqrt{D_{\tau_{xy}}} , где u_{\alpha}\alpha-квантиль стандартного нормального распределения.

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
Личные инструменты