Критерий знаковых рангов Уилкоксона

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(категория, викификация)
 
Строка 1: Строка 1:
{{TOCright}}
{{TOCright}}
-
Критерий знаковых рангов Уилкоксона - [[непараметрический статистический критерий]], используемый для оценки различий между двумя выборками, взятыми из закона распределения, отличного от нормального, либо измеренными с использованием порядковой шкалы.
+
Критерий знаковых рангов Уилкоксона — [[непараметрический статистический критерий]], используемый для оценки различий между двумя выборками, взятыми из закона распределения, отличного от нормального, либо измеренными с использованием порядковой шкалы.
-
Гипотеза <tex>H_0</tex>: медиана разностей в парах равна 0<br/>
+
Гипотеза <tex>H_0</tex>: медиана разностей в парах равна 0<br />
Альтернатива: медиана разностей в парах не равна 0
Альтернатива: медиана разностей в парах не равна 0
 +
== Предположения ==
== Предположения ==
-
*Данные приходят парами
+
* Данные приходят парами
-
*Пары незвасимы и одинаково распределены
+
* Пары незвасимы и одинаково распределены
-
*Данные измерены хотя бы в [[Теория измерений|порядковой шкале]]
+
* Данные измерены хотя бы в [[Теория измерений|порядковой шкале]]
-
*Распределение разностей симметрично относительно медианы
+
* Распределение разностей симметрично относительно медианы
-
==Описание критерия==
+
== Описание критерия ==
-
Пусть <tex>N</tex> - размер выборки (число пар). Обозначим <tex>x_{1,i}</tex> - элементы 1 выборки и <tex>x_{2,i}</tex> - элементы 2 выборки.
+
Пусть <tex>N</tex> — размер выборки (число пар). Обозначим <tex>x_{1,i}</tex> — элементы 1 выборки и <tex>x_{2,i}</tex> — элементы 2 выборки.
: H<sub>0</sub>: медиана разности между парами равна 0
: H<sub>0</sub>: медиана разности между парами равна 0
Строка 19: Строка 20:
# Для <tex>i = 1, ..., N</tex>, вычислить <tex>|x_{2,i} - x_{1,i}|</tex> и <tex>sign(x_{2,i} - x_{1,i})</tex>
# Для <tex>i = 1, ..., N</tex>, вычислить <tex>|x_{2,i} - x_{1,i}|</tex> и <tex>sign(x_{2,i} - x_{1,i})</tex>
-
# Исключить пары, где <tex>|x_{2,i} - x_{1,i}| = 0</tex>. Пусть <tex>N_r</tex> - размер полученной выборки после удаления таких пар
+
# Исключить пары, где <tex>|x_{2,i} - x_{1,i}| = 0</tex>. Пусть <tex>N_r</tex> — размер полученной выборки после удаления таких пар
# Упорядочить оставшиеся <tex>N_r</tex> пар в порядке возрастания модуля разности, <tex>|x_{2,i} - x_{1,i}|</tex>.
# Упорядочить оставшиеся <tex>N_r</tex> пар в порядке возрастания модуля разности, <tex>|x_{2,i} - x_{1,i}|</tex>.
# Построить ранги всех пар, <tex>R_i</tex> обозначает ранг i-й пары.
# Построить ранги всех пар, <tex>R_i</tex> обозначает ранг i-й пары.
Строка 27: Строка 28:
#: For <tex>N_r \ge 10</tex>, a z-score can be calculated as <tex>z = \frac{W - 0.5}{\sigma_W}, \sigma_W = \sqrt{\frac{N_r(N_r + 1)(2N_r + 1)}{6}}</tex>.
#: For <tex>N_r \ge 10</tex>, a z-score can be calculated as <tex>z = \frac{W - 0.5}{\sigma_W}, \sigma_W = \sqrt{\frac{N_r(N_r + 1)(2N_r + 1)}{6}}</tex>.
#: Если <math>z > z_{critical}</math> отклонить <tex>H_0</tex>
#: Если <math>z > z_{critical}</math> отклонить <tex>H_0</tex>
-
#:
+
#:
#: Если <tex>N_r < 10</tex>, <tex>W</tex> Сравнивается с критическими значениями по таблице.
#: Если <tex>N_r < 10</tex>, <tex>W</tex> Сравнивается с критическими значениями по таблице.
#:
#:
Строка 34: Строка 35:
== Реализации ==
== Реализации ==
-
*[http://stat.ethz.ch/R-manual/R-patched/library/stats/html/wilcox.test.html Реализация в R]
+
* [http://stat.ethz.ch/R-manual/R-patched/library/stats/html/wilcox.test.html Реализация в R]
-
*[http://www.mathworks.com/help/stats/signrank.html Реализация в MATLAB]
+
* [http://www.mathworks.com/help/stats/signrank.html Реализация в MATLAB]
{{stub}}
{{stub}}
 +
 +
[[Категория:Прикладная статистика]]
 +
[[Категория:Непараметрические статистические тесты]]

Текущая версия

Содержание

Критерий знаковых рангов Уилкоксона — непараметрический статистический критерий, используемый для оценки различий между двумя выборками, взятыми из закона распределения, отличного от нормального, либо измеренными с использованием порядковой шкалы.


Гипотеза H_0: медиана разностей в парах равна 0
Альтернатива: медиана разностей в парах не равна 0

Предположения

  • Данные приходят парами
  • Пары незвасимы и одинаково распределены
  • Данные измерены хотя бы в порядковой шкале
  • Распределение разностей симметрично относительно медианы

Описание критерия

Пусть N — размер выборки (число пар). Обозначим x_{1,i} — элементы 1 выборки и x_{2,i} — элементы 2 выборки.

H0: медиана разности между парами равна 0
H1: медиана разности между парами не равна 0
  1. Для i = 1, ..., N, вычислить |x_{2,i} - x_{1,i}| и sign(x_{2,i} - x_{1,i})
  2. Исключить пары, где |x_{2,i} - x_{1,i}| = 0. Пусть N_r — размер полученной выборки после удаления таких пар
  3. Упорядочить оставшиеся N_r пар в порядке возрастания модуля разности, |x_{2,i} - x_{1,i}|.
  4. Построить ранги всех пар, R_i обозначает ранг i-й пары.
  5. Вычислить статистику W
    W = |\sum_{i=1}^{N_r} [sign(x_{2,i} - x_{1,i}) \cdot R_i]|, модуль суммы знаковых рангов.
  6. С ростом N_r распределение W сходится к нормальному. Thus,
    For N_r \ge 10, a z-score can be calculated as z = \frac{W - 0.5}{\sigma_W}, \sigma_W = \sqrt{\frac{N_r(N_r + 1)(2N_r + 1)}{6}}.
    Если <math>z > z_{critical}</math> отклонить H_0
    Если N_r < 10, W Сравнивается с критическими значениями по таблице.
    Если W \ge W_{critical, N_r} отвергнуть H_0

Реализации

Личные инструменты