Конкордация Кенделла
Материал из MachineLearning.
(переработка) |
|||
(2 промежуточные версии не показаны) | |||
Строка 1: | Строка 1: | ||
{{TOCright}} | {{TOCright}} | ||
- | '''Конкордация Кенделла''' - это непараметрический статистикий тест. Он обычно используется для измерения статистической связи между несколькими выборками. И если для корреляции Пирсона используется дополнительное предположение о нормальности выборок и сравниваются одновременно только две выборки, то в конкордации Кенделла нет предположения о виде распределении и используется любое количество выборок. | + | '''Конкордация Кенделла''' - это непараметрический статистикий тест. Он обычно используется для измерения статистической связи между несколькими выборками. И если для [[Корреляция Пирсона|корреляции Пирсона]] используется дополнительное предположение о нормальности выборок и сравниваются одновременно только две выборки, то в конкордации Кенделла нет предположения о виде распределении и используется любое количество выборок. |
Строка 11: | Строка 11: | ||
==Определение== | ==Определение== | ||
- | + | Пусть заданы <tex>k\ (k \ge 2)</tex> выборок <tex>x_1=(x_1^1,\ \cdots,x_n^1),\cdots,\ x_k=(x_1^k,\cdots,x_n^k)</tex>. Они все одинаковой длина <tex>n</tex>. | |
- | ''' | + | Для нахождения статистической связи между несколькими выборками Кенделлом был предложен '''ранговый коэффициент конкордации''' |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
<tex>W=\frac{12}{k^2 (n^3-n)}\sum_{i=1}^{n}(\sum_{j=1}^{k}R_{ij}-\frac{k(n+1)}{2})^2</tex>, | <tex>W=\frac{12}{k^2 (n^3-n)}\sum_{i=1}^{n}(\sum_{j=1}^{k}R_{ij}-\frac{k(n+1)}{2})^2</tex>, | ||
Строка 25: | Строка 19: | ||
где <tex>R_{ij}\in\{1,\cdots,n\}</tex> - ранг <tex>i</tex>-го элемента в <tex>X_j</tex> выборке. | где <tex>R_{ij}\in\{1,\cdots,n\}</tex> - ранг <tex>i</tex>-го элемента в <tex>X_j</tex> выборке. | ||
- | ''' | + | Коэффициент конкордации принимает значения от 0 до 1. Причём он равен 1 при максимальной согласованности и равен 0 при максимальной несогласованности. |
+ | |||
+ | |||
+ | Опишем некоторые '''свойства:''' | ||
1) <tex>W\in[0,1]</tex> | 1) <tex>W\in[0,1]</tex> | ||
Причём <tex>W=1</tex> тогда и только тогда, когда <tex>R_{ij}=R_{il} \ \forall i,j,l</tex> | Причём <tex>W=1</tex> тогда и только тогда, когда <tex>R_{ij}=R_{il} \ \forall i,j,l</tex> | ||
- | 2) | + | То, что <tex>W</tex> не принимает отрицательных значений, объясняется тем, что в отличие от случая парных связей для <tex>k\geq 3</tex> выборок противоположность согласованности утрачивается: упорядочения могут полностью совпадать, но не могут полностью не совпадать. |
- | <tex>W=\frac{\rho+1}{2}</tex> | + | |
+ | 2)'''Коэффициент конкордации (согласованности) Кенделла''' может быть представлен | ||
+ | |||
+ | <tex>W=\frac{k-1}{k} \frac{2}{k(k-1)}\sum_{i<j}\rho_{x_i x_j}+\frac{1}{k}</tex> | ||
+ | |||
+ | где <tex>\rho_{x_i x_j}</tex> - [[Коэффициент корреляции Спирмена|коэффициент корреляции Спирмена]] | ||
+ | |||
+ | <tex>\frac{2}{k(k-1)}\sum_{i<j}\rho_{x_i x_j}</tex> - среднее арифметическое Спирмена | ||
+ | |||
+ | При <tex>k=2</tex> получаем, что <tex>W=\frac{\rho+1}{2}</tex> | ||
т.е. коэффициент конкордации <tex>W</tex> линейно зависит от [[Коэффициент корреляции Спирмена|коэффициента корреляции Спирмена]] <tex>\rho</tex> | т.е. коэффициент конкордации <tex>W</tex> линейно зависит от [[Коэффициент корреляции Спирмена|коэффициента корреляции Спирмена]] <tex>\rho</tex> | ||
==Статистическая проверка наличия корреляции== | ==Статистическая проверка наличия корреляции== | ||
- | ''' | + | Проверяется [[Нулевая гипотеза|'''гипотеза''']] <tex>H_0</tex>: выборки <tex>X_1,\cdots,\ X_k</tex> независимы. |
+ | |||
+ | ===Статистика=== | ||
+ | <tex>n(k-1)W</tex> | ||
+ | |||
+ | имеет распрелеление хи-квадрат с <tex>(n-1)</tex> степенью свободы при больших <tex>n</tex> | ||
+ | |||
+ | ===Критерий=== | ||
+ | При <tex>n(k-1)W>\chi_{n-1,\alpha}^2</tex> нулевая гипотеза об отсутствии статистической связи между выборками должна быть отвергнута с [[Уровень значимости|уровнем значимости]] критерия, равным <tex>\alpha</tex>. | ||
+ | <tex>\chi_{n-1,\alpha}^2</tex> - <tex>\alpha</tex> - [[Квантиль|квантиль]] хи-квадрат распределения с <tex>(n-1)</tex> степенью свободы. | ||
- | |||
- | |||
==Литература== | ==Литература== | ||
Строка 53: | Строка 66: | ||
[[Категория: Прикладная статистика]] | [[Категория: Прикладная статистика]] | ||
- | [[Категория:Корреляционный анализ | + | [[Категория:Корреляционный анализ]] |
Текущая версия
|
Конкордация Кенделла - это непараметрический статистикий тест. Он обычно используется для измерения статистической связи между несколькими выборками. И если для корреляции Пирсона используется дополнительное предположение о нормальности выборок и сравниваются одновременно только две выборки, то в конкордации Кенделла нет предположения о виде распределении и используется любое количество выборок.
Пример задачи
(инвестиционные проекты)
Пусть имеется объектов (инвестиционных проектов). В экспертный совет по принятию этих проектов входят человек. Каждый эксперт выставляет оценки каждому проекту в ранговых шкалах. Требуется выяснить, насколько согласны между собой эксперты.
Определение
Пусть заданы выборок . Они все одинаковой длина .
Для нахождения статистической связи между несколькими выборками Кенделлом был предложен ранговый коэффициент конкордации
,
где - ранг -го элемента в выборке.
Коэффициент конкордации принимает значения от 0 до 1. Причём он равен 1 при максимальной согласованности и равен 0 при максимальной несогласованности.
Опишем некоторые свойства:
1) Причём тогда и только тогда, когда
То, что не принимает отрицательных значений, объясняется тем, что в отличие от случая парных связей для выборок противоположность согласованности утрачивается: упорядочения могут полностью совпадать, но не могут полностью не совпадать.
2)Коэффициент конкордации (согласованности) Кенделла может быть представлен
где - коэффициент корреляции Спирмена
- среднее арифметическое Спирмена
При получаем, что т.е. коэффициент конкордации линейно зависит от коэффициента корреляции Спирмена
Статистическая проверка наличия корреляции
Проверяется гипотеза : выборки независимы.
Статистика
имеет распрелеление хи-квадрат с степенью свободы при больших
Критерий
При нулевая гипотеза об отсутствии статистической связи между выборками должна быть отвергнута с уровнем значимости критерия, равным . - - квантиль хи-квадрат распределения с степенью свободы.
Литература
- Лагутин М. Б. Наглядная математическая статистика:Учебное пособие.-М.: БИНОМ. Лаборатория знаний, 2007.-472с.
См. также
Ссылки
- Kendall's W (Wikipedia)