Конкордация Кенделла

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(переработка)
 
(2 промежуточные версии не показаны)
Строка 1: Строка 1:
{{TOCright}}
{{TOCright}}
-
'''Конкордация Кенделла''' - это непараметрический статистикий тест. Он обычно используется для измерения статистической связи между несколькими выборками. И если для корреляции Пирсона используется дополнительное предположение о нормальности выборок и сравниваются одновременно только две выборки, то в конкордации Кенделла нет предположения о виде распределении и используется любое количество выборок.
+
'''Конкордация Кенделла''' - это непараметрический статистикий тест. Он обычно используется для измерения статистической связи между несколькими выборками. И если для [[Корреляция Пирсона|корреляции Пирсона]] используется дополнительное предположение о нормальности выборок и сравниваются одновременно только две выборки, то в конкордации Кенделла нет предположения о виде распределении и используется любое количество выборок.
Строка 11: Строка 11:
==Определение==
==Определение==
-
Заданы <tex>k\ (k \ge 2)</tex> выборок <tex>x_1=(x_1^1,\ \cdots,x_n^1),\cdots,\ x_k=(x_1^k,\cdots,x_n^k)</tex>.
+
Пусть заданы <tex>k\ (k \ge 2)</tex> выборок <tex>x_1=(x_1^1,\ \cdots,x_n^1),\cdots,\ x_k=(x_1^k,\cdots,x_n^k)</tex>. Они все одинаковой длина <tex>n</tex>.
-
'''Коэффициент конкордации (согласованности) Кенделла''' равен
+
Для нахождения статистической связи между несколькими выборками Кенделлом был предложен '''ранговый коэффициент конкордации'''
-
 
+
-
<tex>W=\frac{k-1}{k}\underbrace{ \frac{2}{k(k-1)}\sum_{i<j}\rho_{x_i x_j} }_{Spearman\ simple\ mean}+\frac{1}{k}</tex>
+
-
 
+
-
где <tex>\rho_{x_i x_j}</tex> - [[Коэффициент корреляции Спирмена|коэффициент корреляции Спирмена]]
+
-
 
+
-
'''Ранговый коэффициент конкордации'''
+
<tex>W=\frac{12}{k^2 (n^3-n)}\sum_{i=1}^{n}(\sum_{j=1}^{k}R_{ij}-\frac{k(n+1)}{2})^2</tex>,
<tex>W=\frac{12}{k^2 (n^3-n)}\sum_{i=1}^{n}(\sum_{j=1}^{k}R_{ij}-\frac{k(n+1)}{2})^2</tex>,
Строка 25: Строка 19:
где <tex>R_{ij}\in\{1,\cdots,n\}</tex> - ранг <tex>i</tex>-го элемента в <tex>X_j</tex> выборке.
где <tex>R_{ij}\in\{1,\cdots,n\}</tex> - ранг <tex>i</tex>-го элемента в <tex>X_j</tex> выборке.
-
'''Свойства:'''
+
Коэффициент конкордации принимает значения от 0 до 1. Причём он равен 1 при максимальной согласованности и равен 0 при максимальной несогласованности.
 +
 
 +
 
 +
Опишем некоторые '''свойства:'''
1) <tex>W\in[0,1]</tex>
1) <tex>W\in[0,1]</tex>
Причём <tex>W=1</tex> тогда и только тогда, когда <tex>R_{ij}=R_{il} \ \forall i,j,l</tex>
Причём <tex>W=1</tex> тогда и только тогда, когда <tex>R_{ij}=R_{il} \ \forall i,j,l</tex>
-
2)при <tex>k=2</tex> получаем, что
+
То, что <tex>W</tex> не принимает отрицательных значений, объясняется тем, что в отличие от случая парных связей для <tex>k\geq 3</tex> выборок противоположность согласованности утрачивается: упорядочения могут полностью совпадать, но не могут полностью не совпадать.
-
<tex>W=\frac{\rho+1}{2}</tex>
+
 
 +
2)'''Коэффициент конкордации (согласованности) Кенделла''' может быть представлен
 +
 
 +
<tex>W=\frac{k-1}{k} \frac{2}{k(k-1)}\sum_{i<j}\rho_{x_i x_j}+\frac{1}{k}</tex>
 +
 
 +
где <tex>\rho_{x_i x_j}</tex> - [[Коэффициент корреляции Спирмена|коэффициент корреляции Спирмена]]
 +
 
 +
<tex>\frac{2}{k(k-1)}\sum_{i<j}\rho_{x_i x_j}</tex> - среднее арифметическое Спирмена
 +
 +
При <tex>k=2</tex> получаем, что <tex>W=\frac{\rho+1}{2}</tex>
т.е. коэффициент конкордации <tex>W</tex> линейно зависит от [[Коэффициент корреляции Спирмена|коэффициента корреляции Спирмена]] <tex>\rho</tex>
т.е. коэффициент конкордации <tex>W</tex> линейно зависит от [[Коэффициент корреляции Спирмена|коэффициента корреляции Спирмена]] <tex>\rho</tex>
==Статистическая проверка наличия корреляции==
==Статистическая проверка наличия корреляции==
-
'''Гипотеза''' <tex>H_0:\ X_1,\cdots,\ X_k</tex> независимы.
+
Проверяется [[Нулевая гипотеза|'''гипотеза''']] <tex>H_0</tex>: выборки <tex>X_1,\cdots,\ X_k</tex> независимы.
 +
 
 +
===Статистика===
 +
<tex>n(k-1)W</tex>
 +
 
 +
имеет распрелеление хи-квадрат с <tex>(n-1)</tex> степенью свободы при больших <tex>n</tex>
 +
 
 +
===Критерий===
 +
При <tex>n(k-1)W>\chi_{n-1,\alpha}^2</tex> нулевая гипотеза об отсутствии статистической связи между выборками должна быть отвергнута с [[Уровень значимости|уровнем значимости]] критерия, равным <tex>\alpha</tex>.
 +
<tex>\chi_{n-1,\alpha}^2</tex> - <tex>\alpha</tex> - [[Квантиль|квантиль]] хи-квадрат распределения с <tex>(n-1)</tex> степенью свободы.
-
'''Статистика''': <tex>n(k-1)W</tex>
 
-
имеет распрелеление хи-квадрат с <tex>(n-1)</tex> степенями свободы
 
==Литература==
==Литература==
Строка 53: Строка 66:
[[Категория: Прикладная статистика]]
[[Категория: Прикладная статистика]]
-
[[Категория:Корреляционный анализ]]
+
[[Категория:Корреляционный анализ]]

Текущая версия

Содержание

Конкордация Кенделла - это непараметрический статистикий тест. Он обычно используется для измерения статистической связи между несколькими выборками. И если для корреляции Пирсона используется дополнительное предположение о нормальности выборок и сравниваются одновременно только две выборки, то в конкордации Кенделла нет предположения о виде распределении и используется любое количество выборок.


Пример задачи

(инвестиционные проекты)

Пусть имеется n объектов (инвестиционных проектов). В экспертный совет по принятию этих проектов входят k человек. Каждый эксперт выставляет оценки каждому проекту в ранговых шкалах. Требуется выяснить, насколько согласны между собой эксперты.


Определение

Пусть заданы k\ (k \ge 2) выборок x_1=(x_1^1,\ \cdots,x_n^1),\cdots,\ x_k=(x_1^k,\cdots,x_n^k). Они все одинаковой длина n.

Для нахождения статистической связи между несколькими выборками Кенделлом был предложен ранговый коэффициент конкордации

W=\frac{12}{k^2 (n^3-n)}\sum_{i=1}^{n}(\sum_{j=1}^{k}R_{ij}-\frac{k(n+1)}{2})^2,

где R_{ij}\in\{1,\cdots,n\} - ранг i-го элемента в X_j выборке.

Коэффициент конкордации принимает значения от 0 до 1. Причём он равен 1 при максимальной согласованности и равен 0 при максимальной несогласованности.


Опишем некоторые свойства:

1) W\in[0,1] Причём W=1 тогда и только тогда, когда R_{ij}=R_{il} \ \forall i,j,l

То, что W не принимает отрицательных значений, объясняется тем, что в отличие от случая парных связей для k\geq 3 выборок противоположность согласованности утрачивается: упорядочения могут полностью совпадать, но не могут полностью не совпадать.

2)Коэффициент конкордации (согласованности) Кенделла может быть представлен

W=\frac{k-1}{k} \frac{2}{k(k-1)}\sum_{i<j}\rho_{x_i x_j}+\frac{1}{k}

где \rho_{x_i x_j} - коэффициент корреляции Спирмена

\frac{2}{k(k-1)}\sum_{i<j}\rho_{x_i x_j} - среднее арифметическое Спирмена

При k=2 получаем, что W=\frac{\rho+1}{2} т.е. коэффициент конкордации W линейно зависит от коэффициента корреляции Спирмена \rho


Статистическая проверка наличия корреляции

Проверяется гипотеза H_0: выборки X_1,\cdots,\ X_k независимы.

Статистика

n(k-1)W

имеет распрелеление хи-квадрат с (n-1) степенью свободы при больших n

Критерий

При n(k-1)W>\chi_{n-1,\alpha}^2 нулевая гипотеза об отсутствии статистической связи между выборками должна быть отвергнута с уровнем значимости критерия, равным \alpha. \chi_{n-1,\alpha}^2 - \alpha - квантиль хи-квадрат распределения с (n-1) степенью свободы.


Литература

  1. Лагутин М. Б. Наглядная математическая статистика:Учебное пособие.-М.: БИНОМ. Лаборатория знаний, 2007.-472с.

См. также

Ссылки

Личные инструменты