Критерий знаковых рангов Уилкоксона
Материал из MachineLearning.
|
Критерий знаковых рангов Уилкоксона - непараметрический статистический критерий, используемый для оценки различий между двумя выборками, взятыми из закона распределения, отличного от нормального, либо измеренными с использованием порядковой шкалы.
Гипотеза : медиана разностей в парах равна 0
Альтернатива: медиана разностей в парах не равна 0
Предположения
- Данные приходят парами
- Пары незвасимы и одинаково распределены
- Данные измерены хотя бы в порядковой шкале
- Распределение разностей симметрично относительно медианы
Описание критерия
Пусть - размер выборки (число пар). Обозначим - элементы 1 выборки и - элементы 2 выборки.
- H0: медиана разности между парами равна 0
- H1: медиана разности между парами не равна 0
- Для , вычислить и
- Исключить пары, где . Пусть - размер полученной выборки после удаления таких пар
- Упорядочить оставшиеся пар в порядке возрастания модуля разности, .
- Rank the pairs, starting with the smallest as 1. Ties receive a rank equal to the average of the ranks they span. Пусть обозначает ранг.
- Вычислить статистику
- , модуль суммы знаковых рангов.
- С ростом распределение сходится к нормальному. Thus,
- For , a z-score can be calculated as .
- Если <math>z > z_{critical}</math> отклонить
- Если , Сравнивается с критическими значениями по таблице.
- Если отвергнуть