Участник:Василий Ломакин/Критерий Уилкоксона для связных выборок
Материал из MachineLearning.
Строка 7: | Строка 7: | ||
# Ссылка на что такое связки | # Ссылка на что такое связки | ||
# Иллюстрации - критическая область, мощность и т.п. | # Иллюстрации - критическая область, мощность и т.п. | ||
+ | # Вычисление рангов для связок | ||
- | '''Критерий Уилкоксона для связных выборок''' (Wilcoxon signed-rank test) — [[непараметрический статистический критерий]], применяемый для проверки гипотезы о равенстве средних в двух '''зависимых''' выборках. Является аналогом [[Критерий_Стьюдента|t-критерия Стьюдента для парных наблюдений]] в случае закона распределения, отличного от нормального, либо для данных в | + | '''Критерий Уилкоксона для связных выборок''' (Wilcoxon signed-rank test) — [[непараметрический статистический критерий]], применяемый для проверки гипотезы о равенстве средних в двух '''зависимых''' выборках. Является аналогом [[Критерий_Стьюдента|t-критерия Стьюдента для парных наблюдений]] в случае закона распределения, отличного от нормального, либо для данных в [[Теория измерений|качественной шкале]]. |
== Пример задачи == | == Пример задачи == | ||
Строка 23: | Строка 24: | ||
'''[[Нулевая гипотеза]]''' <tex>H_0:\; \mathbb{P} \{x_i-y_i < 0 \} = 1/2</tex>. | '''[[Нулевая гипотеза]]''' <tex>H_0:\; \mathbb{P} \{x_i-y_i < 0 \} = 1/2</tex>. | ||
- | ''' | + | '''Вычисление статистики критерия:''' |
# Рассчитать значения разностей пар двух выборок. Нулевые разности далее не учитываются. <tex>N</tex> - количество ненулевых разностей. | # Рассчитать значения разностей пар двух выборок. Нулевые разности далее не учитываются. <tex>N</tex> - количество ненулевых разностей. | ||
# Проранжировать модули разностей пар в возрастающем порядке. | # Проранжировать модули разностей пар в возрастающем порядке. | ||
Строка 38: | Строка 39: | ||
Рассмотрим нормированную и центрированную статистика Уилкоксона: | Рассмотрим нормированную и центрированную статистика Уилкоксона: | ||
- | :<tex>T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}</tex>; | + | :<tex>\tilde T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}</tex>; |
- | <tex>T</tex> асимптотически имеет стандартное нормальное распределение при <tex>N \ge 20</tex>. | + | <tex>\tilde T</tex> асимптотически имеет стандартное нормальное распределение. Аппроксимация начинает хорошо работать при <tex>N \ge 20</tex>. |
При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее: | При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее: |
Версия 23:18, 11 декабря 2009
TODO:
- Пример
- Критерий для коротких выборок
- Свойства и границы применимости критерия
- Всё ли я извлёк из обоих книг?
- Дополнительные предположения
- Ссылка на что такое связки
- Иллюстрации - критическая область, мощность и т.п.
- Вычисление рангов для связок
Критерий Уилкоксона для связных выборок (Wilcoxon signed-rank test) — непараметрический статистический критерий, применяемый для проверки гипотезы о равенстве средних в двух зависимых выборках. Является аналогом t-критерия Стьюдента для парных наблюдений в случае закона распределения, отличного от нормального, либо для данных в качественной шкале.
Содержание |
Пример задачи
Описание критерия
Заданы две выборки .
Дополнительные предположения:
- простые выборки ????
- выборки связные, то есть элементы соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).
Вычисление статистики критерия:
- Рассчитать значения разностей пар двух выборок. Нулевые разности далее не учитываются. - количество ненулевых разностей.
- Проранжировать модули разностей пар в возрастающем порядке.
- Приписать рангам знаки соответствующих им разностей.
- Рассчитать сумму положительных рангов.
Критерий (при уровне значимости ):
Против альтернативы :
- если больше табличного значения критерия знаковых рангов Уилкоксона с уровнем значимости и числом степеней свободы , то нулевая гипотеза отвергается.
Асимптотический критерий:
Рассмотрим нормированную и центрированную статистика Уилкоксона:
- ;
асимптотически имеет стандартное нормальное распределение. Аппроксимация начинает хорошо работать при .
При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:
- где - количество связок, - их размеры.
Другие гипотезы:
средняя разница между значениями пар двух выборок равна заданной константе A.
средняя разница не равна A.
В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме.
Свойства и границы применимости критерия
м?
История
Данный критерий назван именем Френка Уилкоксона (1892-1965). Статья, выпущенная им в 1945 году, содержала также описание аналогичного метода для случая независимых выборок.
Литература
- Лапач С. Н., Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 457-458 с.
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Критерий Уилкоксона-Манна-Уитни
- Wilcoxon signed-rank test (Wikipedia).