Участник:Василий Ломакин/Критерий Уилкоксона для связных выборок
Материал из MachineLearning.
Строка 1: | Строка 1: | ||
- | '''Критерий Уилкоксона для связных выборок''' — [[непараметрический статистический критерий]]. | + | '''Критерий Уилкоксона для связных выборок''' — [[непараметрический статистический критерий]], применяющийся для связанных пар наблюдений. Наиболее часто используется для проверки гипотезы о равенстве средних в двух зависимых выборках. Является аналогом соответствующего [[Критерий_Стьюдента|t-критерия Стьюдента для парных наблюдений]] в случае закона распределения, отличного от нормального, либо для данных в нечисловой шкале. |
== Пример задачи == | == Пример задачи == | ||
Строка 9: | Строка 9: | ||
'''Дополнительные предположения:''' | '''Дополнительные предположения:''' | ||
- | * | + | * простые выборки ???? |
- | * | + | * выборки связные, то есть элементы <tex>x_i,\: y_i</tex> соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки). |
'''[[Нулевая гипотеза]]''' <tex>H_0:\; \mathbb{P} \{x_i-y_i < 0 \} = 1/2</tex>. | '''[[Нулевая гипотеза]]''' <tex>H_0:\; \mathbb{P} \{x_i-y_i < 0 \} = 1/2</tex>. | ||
Строка 28: | Строка 28: | ||
Рассмотрим нормированную и центрированную статистика Уилкоксона: | Рассмотрим нормированную и центрированную статистика Уилкоксона: | ||
- | + | <tex>T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}</tex>; | |
- | + | <tex>T</tex> асимптотически имеет стандартное нормальное распределение при <tex>N \ge 20</tex> | |
- | + | При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее: | |
- | + | <tex>\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},</tex> | |
- | + | где <tex>g</tex> - количество связок, <tex>t_1, \ldots, t_g</tex> - их размеры. | |
'''Другие гипотезы''': | '''Другие гипотезы''': | ||
+ | |||
<tex>H_0:\; </tex> средняя разница между значениями пар двух выборок равна заданной константе A. | <tex>H_0:\; </tex> средняя разница между значениями пар двух выборок равна заданной константе A. | ||
+ | |||
<tex>H_1:\; </tex> средняя разница не равна A. | <tex>H_1:\; </tex> средняя разница не равна A. | ||
Версия 18:36, 11 декабря 2009
Критерий Уилкоксона для связных выборок — непараметрический статистический критерий, применяющийся для связанных пар наблюдений. Наиболее часто используется для проверки гипотезы о равенстве средних в двух зависимых выборках. Является аналогом соответствующего t-критерия Стьюдента для парных наблюдений в случае закона распределения, отличного от нормального, либо для данных в нечисловой шкале.
Содержание |
Пример задачи
Описание критерия
Заданы две выборки .
Дополнительные предположения:
- простые выборки ????
- выборки связные, то есть элементы соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).
Статистика критерия:
- Рассчитать значения разностей пар двух выборок. Нулевые разности далее не учитываются. - количество ненулевых разностей.
- Проранжировать модули разностей пар в возрастающем порядке.
- Приписать рангам знаки соответствующих им разностей.
- Рассчитать сумму положительных рангов.
Критерий (при уровне значимости ):
Против альтернативы :
- если больше табличного значения критерия знаковых рангов Уилкоксона с уровнем значимости и числом степеней свободы , то нулевая гипотеза отвергается.
Асимптотический критерий:
Рассмотрим нормированную и центрированную статистика Уилкоксона: ; асимптотически имеет стандартное нормальное распределение при
При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:
где - количество связок, - их размеры.
Другие гипотезы:
средняя разница между значениями пар двух выборок равна заданной константе A.
средняя разница не равна A.
В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме.
Свойства и границы применимости критерия
Литература
- Лапач С. Н., Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 457-458 с.
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Статистика (функция выборки)