Критерий знаковых рангов Уилкоксона
Материал из MachineLearning.
|
Критерий знаковых рангов Уилкоксона — непараметрический статистический критерий, используемый для оценки различий между двумя выборками, взятыми из закона распределения, отличного от нормального, либо измеренными с использованием порядковой шкалы.
Гипотеза : медиана разностей в парах равна 0
Альтернатива: медиана разностей в парах не равна 0
Предположения
- Данные приходят парами
- Пары незвасимы и одинаково распределены
- Данные измерены хотя бы в порядковой шкале
- Распределение разностей симметрично относительно медианы
Описание критерия
Пусть — размер выборки (число пар). Обозначим
— элементы 1 выборки и
— элементы 2 выборки.
- H0: медиана разности между парами равна 0
- H1: медиана разности между парами не равна 0
- Для
, вычислить
и
- Исключить пары, где
. Пусть
— размер полученной выборки после удаления таких пар
- Упорядочить оставшиеся
пар в порядке возрастания модуля разности,
.
- Построить ранги всех пар,
обозначает ранг i-й пары.
- Вычислить статистику
-
, модуль суммы знаковых рангов.
-
- С ростом
распределение
сходится к нормальному. Thus,
- For
, a z-score can be calculated as
.
- Если <math>z > z_{critical}</math> отклонить
- Если
,
Сравнивается с критическими значениями по таблице.
- Если
отвергнуть
- For