Критерий знаковых рангов Уилкоксона
Материал из MachineLearning.
(Различия между версиями)
(категория, викификация) |
|||
(2 промежуточные версии не показаны) | |||
Строка 1: | Строка 1: | ||
{{TOCright}} | {{TOCright}} | ||
- | Критерий знаковых рангов | + | Критерий знаковых рангов Уилкоксона — [[непараметрический статистический критерий]], используемый для оценки различий между двумя выборками, взятыми из закона распределения, отличного от нормального, либо измеренными с использованием порядковой шкалы. |
- | Гипотеза <tex>H_0</tex>: медиана разностей в парах равна 0<br/> | + | Гипотеза <tex>H_0</tex>: медиана разностей в парах равна 0<br /> |
Альтернатива: медиана разностей в парах не равна 0 | Альтернатива: медиана разностей в парах не равна 0 | ||
+ | |||
== Предположения == | == Предположения == | ||
- | *Данные приходят парами | + | * Данные приходят парами |
- | *Пары незвасимы и одинаково распределены | + | * Пары незвасимы и одинаково распределены |
- | *Данные измерены хотя бы в [[Теория измерений|порядковой шкале]] | + | * Данные измерены хотя бы в [[Теория измерений|порядковой шкале]] |
- | *Распределение разностей симметрично относительно медианы | + | * Распределение разностей симметрично относительно медианы |
- | ==Описание критерия== | + | == Описание критерия == |
- | Пусть <tex>N</tex> | + | Пусть <tex>N</tex> — размер выборки (число пар). Обозначим <tex>x_{1,i}</tex> — элементы 1 выборки и <tex>x_{2,i}</tex> — элементы 2 выборки. |
: H<sub>0</sub>: медиана разности между парами равна 0 | : H<sub>0</sub>: медиана разности между парами равна 0 | ||
Строка 19: | Строка 20: | ||
# Для <tex>i = 1, ..., N</tex>, вычислить <tex>|x_{2,i} - x_{1,i}|</tex> и <tex>sign(x_{2,i} - x_{1,i})</tex> | # Для <tex>i = 1, ..., N</tex>, вычислить <tex>|x_{2,i} - x_{1,i}|</tex> и <tex>sign(x_{2,i} - x_{1,i})</tex> | ||
- | # Исключить пары, где <tex>|x_{2,i} - x_{1,i}| = 0</tex>. Пусть <tex>N_r</tex> | + | # Исключить пары, где <tex>|x_{2,i} - x_{1,i}| = 0</tex>. Пусть <tex>N_r</tex> — размер полученной выборки после удаления таких пар |
# Упорядочить оставшиеся <tex>N_r</tex> пар в порядке возрастания модуля разности, <tex>|x_{2,i} - x_{1,i}|</tex>. | # Упорядочить оставшиеся <tex>N_r</tex> пар в порядке возрастания модуля разности, <tex>|x_{2,i} - x_{1,i}|</tex>. | ||
- | # | + | # Построить ранги всех пар, <tex>R_i</tex> обозначает ранг i-й пары. |
# Вычислить статистику <tex>W</tex> | # Вычислить статистику <tex>W</tex> | ||
#: <tex>W = |\sum_{i=1}^{N_r} [sign(x_{2,i} - x_{1,i}) \cdot R_i]|</tex>, модуль суммы знаковых рангов. | #: <tex>W = |\sum_{i=1}^{N_r} [sign(x_{2,i} - x_{1,i}) \cdot R_i]|</tex>, модуль суммы знаковых рангов. | ||
Строка 27: | Строка 28: | ||
#: For <tex>N_r \ge 10</tex>, a z-score can be calculated as <tex>z = \frac{W - 0.5}{\sigma_W}, \sigma_W = \sqrt{\frac{N_r(N_r + 1)(2N_r + 1)}{6}}</tex>. | #: For <tex>N_r \ge 10</tex>, a z-score can be calculated as <tex>z = \frac{W - 0.5}{\sigma_W}, \sigma_W = \sqrt{\frac{N_r(N_r + 1)(2N_r + 1)}{6}}</tex>. | ||
#: Если <math>z > z_{critical}</math> отклонить <tex>H_0</tex> | #: Если <math>z > z_{critical}</math> отклонить <tex>H_0</tex> | ||
- | #: | + | #: |
#: Если <tex>N_r < 10</tex>, <tex>W</tex> Сравнивается с критическими значениями по таблице. | #: Если <tex>N_r < 10</tex>, <tex>W</tex> Сравнивается с критическими значениями по таблице. | ||
#: | #: | ||
#: Если <tex>W \ge W_{critical, N_r}</tex> отвергнуть <tex>H_0</tex> | #: Если <tex>W \ge W_{critical, N_r}</tex> отвергнуть <tex>H_0</tex> | ||
- | |||
== Реализации == | == Реализации == | ||
- | *[http://stat.ethz.ch/R-manual/R-patched/library/stats/html/wilcox.test.html Реализация в R] | + | * [http://stat.ethz.ch/R-manual/R-patched/library/stats/html/wilcox.test.html Реализация в R] |
- | *[http://www.mathworks.com/help/stats/signrank.html Реализация в MATLAB] | + | * [http://www.mathworks.com/help/stats/signrank.html Реализация в MATLAB] |
+ | |||
+ | {{stub}} | ||
+ | |||
+ | [[Категория:Прикладная статистика]] | ||
+ | [[Категория:Непараметрические статистические тесты]] |
Текущая версия
|
Критерий знаковых рангов Уилкоксона — непараметрический статистический критерий, используемый для оценки различий между двумя выборками, взятыми из закона распределения, отличного от нормального, либо измеренными с использованием порядковой шкалы.
Гипотеза : медиана разностей в парах равна 0
Альтернатива: медиана разностей в парах не равна 0
Предположения
- Данные приходят парами
- Пары незвасимы и одинаково распределены
- Данные измерены хотя бы в порядковой шкале
- Распределение разностей симметрично относительно медианы
Описание критерия
Пусть — размер выборки (число пар). Обозначим — элементы 1 выборки и — элементы 2 выборки.
- H0: медиана разности между парами равна 0
- H1: медиана разности между парами не равна 0
- Для , вычислить и
- Исключить пары, где . Пусть — размер полученной выборки после удаления таких пар
- Упорядочить оставшиеся пар в порядке возрастания модуля разности, .
- Построить ранги всех пар, обозначает ранг i-й пары.
- Вычислить статистику
- , модуль суммы знаковых рангов.
- С ростом распределение сходится к нормальному. Thus,
- For , a z-score can be calculated as .
- Если <math>z > z_{critical}</math> отклонить
- Если , Сравнивается с критическими значениями по таблице.
- Если отвергнуть