Коэффициент корреляции Кенделла
Материал из MachineLearning.
(Отмена правки № 10605 участника Василий Ломакин (обсуждение)) |
|||
Строка 1: | Строка 1: | ||
{{TOCright}} | {{TOCright}} | ||
+ | Корреляцию Кенделла также называют мерой взаимной неупорядоченности или рассогласования. | ||
- | + | ==Определение== | |
- | == | + | Заданы две выборки <tex>x = (x_1,\ldots,x_n),\;\; y = (y_1,\ldots,y_n)</tex>. |
- | + | '''Коэффициент корреляции Кенделла''', равен | |
+ | :: <tex>\tau=1-\frac{4}{n(n-1)}\sum_{i=1}^{n-1}\sum_{j=i+1}^n\left[[x_i<x_j]\neq[y_i<y_j]\right]</tex>, | ||
- | + | где [логическое выражение]=1, если логическое выражение верно, иначе, 0, например, | |
+ | <tex>[x_i<x_j]=\left\{ \begin{array}{l} 1, x_i>x_j;\\ 0, x_i \geq x_j.\\ \end{array} \right</tex> | ||
- | + | Коэффициент <tex>\tau</tex> принимает значения от -1 до 1. Равенство <tex>\tau=1</tex> указывает на строгую линейную корреляцию. | |
- | + | ||
- | + | ||
- | Коэффициент <tex>\tau</tex> принимает значения | + | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
==Статистическая проверка наличия корреляции== | ==Статистическая проверка наличия корреляции== | ||
- | + | '''Гипотеза <tex>H_0</tex>:''' Выборки <tex>x</tex> и <tex>y</tex> не коррелируют. | |
- | ''' | + | '''Статистика критерия:''' |
+ | ::<tex>\frac{\tau}{\sqrt{D_{\tau}}},</tex> | ||
+ | где <tex>D_{\tau}=\frac{2(2n+5)}{9n(n-1)}</tex>. | ||
- | + | При <tex>n\geq 10</tex> статистику критерия можно приблизить нормальным распределением с параметрами (0,1): | |
+ | ::<tex>\frac{\tau}{\sqrt{D_{\tau}}}\sim N(0,1)</tex> | ||
- | ''' | + | '''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>): |
+ | *против альтернативы <tex>H_1</tex>: наличие корреляции | ||
+ | :: если <tex>|\tau| > \tau_{\alpha}=u_{\alpha}\cdot\sqrt{D_{\tau_{xy}}} </tex>, где <tex>u_{\alpha}</tex> — <tex>\alpha</tex>-квантиль стандартного нормального распределения. | ||
- | + | ==Связь коэффициента корреляции Кенделла с [[коэффициент корреляции Пирсона|коэффициентом корреляции Пирсона]]== | |
- | + | В случае выборок из нормального распределения коэффициент корреляции Кенделла <tex>\tau</tex> может быть использован для оценки [[коэффициент корреляции Пирсона|коэффициента корреляции Пирсона]] <tex>r</tex> по формуле | |
+ | :: <tex>r=sin{\frac{\pi\tau}{2}}</tex> | ||
- | + | ==Связь коэффициента корреляции Кенделла с [[Коэффициент корреляции Спирмена|коэффициентом корреляциии Спирмена]]== | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | == | + | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
Выборкам <tex>x</tex> и <tex>y</tex> соответствуют последовательности рангов: | Выборкам <tex>x</tex> и <tex>y</tex> соответствуют последовательности рангов: | ||
Строка 89: | Строка 40: | ||
::<tex>R_y=(R_{y_1},\ldots,R_{y_n})</tex>, где <tex>R_{y_i}</tex> — ранг <tex>i</tex>-го объекта в [[вариационный ряд|вариационном ряду]] выборки <tex>y</tex>. | ::<tex>R_y=(R_{y_1},\ldots,R_{y_n})</tex>, где <tex>R_{y_i}</tex> — ранг <tex>i</tex>-го объекта в [[вариационный ряд|вариационном ряду]] выборки <tex>y</tex>. | ||
- | Проведем операцию | + | Проведем операцию упорядочевания рангов. |
- | Расположим ряд значений <tex>x_i</tex> в порядке возрастания величины: <tex>x_1\leq x_2\leq\cdots\leq x_n</tex>. Тогда последовательность рангов упорядоченной выборки <tex>x</tex> будет представлять собой последовательность натуральных чисел <tex>1,2,\cdots,n</tex>. Значения <tex>y</tex>, соответствующие значениям <tex>x</tex>, образуют в этом случае некоторую последовательность рангов <tex>T=(T_1,\cdots,T_n)</tex> | + | Расположим ряд значений <tex>x_i</tex> в порядке возрастания величины: <tex>x_1\leq x_2\leq\cdots\leq x_n</tex>. Тогда последовательность рангов упорядоченной выборки <tex>x</tex> будет представлять собой последовательность натуральных чисел <tex>1,2,\cdots,n</tex>. Значения <tex>y</tex>, соответствующие значениям <tex>x</tex>, образуют в этом случае некоторую последовательность рангов <tex>T=(T_1,\cdots,T_n)</tex>. |
- | ::<tex>(R_{x_i}, | + | ::<tex>(R_{x_i},R_{y_i})\rightarrow^{sort} (i,T_i),\; i=1,\cdots,n</tex> (<tex>sort</tex> — операция упорядочевания рангов). |
Коэффициент корреляции Кенделла <tex>\tau</tex> и [[коэффициент корреляции Спирмена]] <tex>\rho</tex> выражаются через ранги <tex>T_i,\; i=1,\cdots,n</tex> следующим образом: | Коэффициент корреляции Кенделла <tex>\tau</tex> и [[коэффициент корреляции Спирмена]] <tex>\rho</tex> выражаются через ранги <tex>T_i,\; i=1,\cdots,n</tex> следующим образом: | ||
- | ::<tex>\rho=1-\frac{12}{n^3-n}\sum_{i<j}{(j-i)[T_i | + | ::<tex>\rho=1-\frac{12}{n^3-n}\sum_{i<j}{(j-i)[T_i>T_j]}</tex> |
- | ::<tex>\tau=1-\frac{4}{n^2-1}\sum_{i<j}[T_i | + | ::<tex>\tau=1-\frac{4}{n^2-1}\sum_{i<j}[T_i>T_j]</tex> |
- | + | Коэффициент корреляции Спирмена учитывает насколько сильна неупорядоченность. | |
- | '''Утверждение.''' | + | '''Утверждение.''' Если выборки <tex>x</tex> и <tex>y</tex> не коррелируют (выполняется гипотеза <tex>H_0</tex>), то коэффициент корреляции между величинами <tex>\rho</tex> и <tex>\tau</tex> можно вычислить по формуле: |
- | ::<tex>corr(\rho, | + | ::<tex>corr(\rho,\tau)=\frac{2n+2}{\sqrt{4n^2+10n}}</tex> |
- | == | + | == Литература == |
- | + | # ''Кобзарь А. И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с. | |
+ | # ''Лагутин М. Б.'' Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003 | ||
- | == | + | ==См. также== |
- | + | *[[Коэффициент корреляции Пирсона]] | |
- | + | *[[Ранговая корреляция]] | |
- | + | *[[Коэффициент корреляции Спирмена]] | |
- | + | ||
- | + | ||
- | + | ||
==Ссылки== | ==Ссылки== | ||
- | + | *[http://ru.wikipedia.org/wiki/Коэффициент_корреляции Коэффициент корреляции](Википедия) | |
- | + | *[http://ru.wikipedia.org/wiki/Корреляционный_анализ Корреляционный анализ] (Википедия) | |
- | + | ||
- | *[http://ru.wikipedia.org/wiki/Коэффициент_корреляции Коэффициент корреляции] | + | |
- | *[http:// | + | |
[[Категория:Прикладная статистика]] | [[Категория:Прикладная статистика]] |
Версия 14:30, 4 января 2010
|
Корреляцию Кенделла также называют мерой взаимной неупорядоченности или рассогласования.
Определение
Заданы две выборки .
Коэффициент корреляции Кенделла, равен
- ,
где [логическое выражение]=1, если логическое выражение верно, иначе, 0, например,
Коэффициент принимает значения от -1 до 1. Равенство указывает на строгую линейную корреляцию.
Статистическая проверка наличия корреляции
Гипотеза : Выборки и не коррелируют.
Статистика критерия:
где .
При статистику критерия можно приблизить нормальным распределением с параметрами (0,1):
Критерий (при уровне значимости ):
- против альтернативы : наличие корреляции
- если , где — -квантиль стандартного нормального распределения.
Связь коэффициента корреляции Кенделла с коэффициентом корреляции Пирсона
В случае выборок из нормального распределения коэффициент корреляции Кенделла может быть использован для оценки коэффициента корреляции Пирсона по формуле
Связь коэффициента корреляции Кенделла с коэффициентом корреляциии Спирмена
Выборкам и соответствуют последовательности рангов:
- , где — ранг -го объекта в вариационном ряду выборки ;
- , где — ранг -го объекта в вариационном ряду выборки .
Проведем операцию упорядочевания рангов.
Расположим ряд значений в порядке возрастания величины: . Тогда последовательность рангов упорядоченной выборки будет представлять собой последовательность натуральных чисел . Значения , соответствующие значениям , образуют в этом случае некоторую последовательность рангов .
- ( — операция упорядочевания рангов).
Коэффициент корреляции Кенделла и коэффициент корреляции Спирмена выражаются через ранги следующим образом:
Коэффициент корреляции Спирмена учитывает насколько сильна неупорядоченность.
Утверждение. Если выборки и не коррелируют (выполняется гипотеза ), то коэффициент корреляции между величинами и можно вычислить по формуле:
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
- Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003
См. также
Ссылки
- Коэффициент корреляции(Википедия)
- Корреляционный анализ (Википедия)
Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |