Конкордация Кенделла

Материал из MachineLearning.

Версия от 22:43, 11 января 2009; Ekaterina Mikhaylova (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

Содержание

Конкордация Кенделла - это непараметрический статистикий тест. Он обычно используется для измерения статистической связи между несколькими выборками. И если для корреляции Пирсона используется дополнительное предположение о нормальности выборок и сравниваются одновременно только две выборки, то в конкордации Кенделла нет предположения о виде распределении и используется любое количество выборок.


Пример задачи

(инвестиционные проекты)

Пусть имеется n объектов (инвестиционных проектов). В экспертный совет по принятию этих проектов входят k человек. Каждый эксперт выставляет оценки каждому проекту в ранговых шкалах. Требуется выяснить, насколько согласны между собой эксперты.


Определение

Пусть заданы k\ (k \ge 2) выборок x_1=(x_1^1,\ \cdots,x_n^1),\cdots,\ x_k=(x_1^k,\cdots,x_n^k). Они все одинаковой длина n.

Для нахождения статистической связи между несколькими выборками Кенделлом был предложен ранговый коэффициент конкордации

W=\frac{12}{k^2 (n^3-n)}\sum_{i=1}^{n}(\sum_{j=1}^{k}R_{ij}-\frac{k(n+1)}{2})^2,

где R_{ij}\in\{1,\cdots,n\} - ранг i-го элемента в X_j выборке.

Коэффициент конкордации принимает значения от 0 до 1. Причём он равен 1 при максимальной согласованности и равен 0 при максимальной несогласованности.


Опишем некоторые свойства:

1) W\in[0,1] Причём W=1 тогда и только тогда, когда R_{ij}=R_{il} \ \forall i,j,l

То, что W не принимает отрицательных значений, объясняется тем, что в отличие от случая парных связей для k\geq 3 выборок противоположность согласованности утрачивается: упорядочения могут полностью совпадать, но не могут полностью не совпадать.

2)Коэффициент конкордации (согласованности) Кенделла может быть представлен

W=\frac{k-1}{k} \frac{2}{k(k-1)}\sum_{i<j}\rho_{x_i x_j}+\frac{1}{k}

где \rho_{x_i x_j} - коэффициент корреляции Спирмена

\frac{2}{k(k-1)}\sum_{i<j}\rho_{x_i x_j} - среднее арифметическое Спирмена

При k=2 получаем, что W=\frac{\rho+1}{2} т.е. коэффициент конкордации W линейно зависит от коэффициента корреляции Спирмена \rho


Статистическая проверка наличия корреляции

Проверяется гипотеза H_0: выборки X_1,\cdots,\ X_k независимы.

Статистика

n(k-1)W

имеет распрелеление хи-квадрат с (n-1) степенью свободы при больших n

Критерий

При n(k-1)W>\chi_{n-1,\alpha}^2 нулевая гипотеза об отсутствии статистической связи между выборками должна быть отвергнута с уровнем значимости критерия, равным \alpha. \chi_{n-1,\alpha}^2 - \alpha - квантиль хи-квадрат распределения с (n-1) степенью свободы.


Литература

  1. Лагутин М. Б. Наглядная математическая статистика:Учебное пособие.-М.: БИНОМ. Лаборатория знаний, 2007.-472с.

См. также

Ссылки

Личные инструменты