Участник:Василий Ломакин/Критерий Уилкоксона двухвыборочный
Материал из MachineLearning.
Строка 1: | Строка 1: | ||
- | '''Критерий Уилкоксона двухвыборочный''' — [[непараметрический статистический критерий]], используемый для проверки гипотезы о равенстве средних двух независимых выборок. Выборки взяты из закона распределения, отличного от нормального, либо данные измерены с использованием нечисловой шкалы. Метод следует использовать | + | '''Критерий Уилкоксона двухвыборочный''' — [[непараметрический статистический критерий]], используемый для проверки гипотезы о равенстве средних двух независимых выборок. Выборки взяты из закона распределения, отличного от нормального, либо данные измерены с использованием нечисловой шкалы. Метод следует использовать, когда нет информации о дисперсии выборок. В случае равных дисперсий следует применять более мощный [[Критерий_Уилкоксона-Манна-Уитни|U-критерий Манна-Уитни]]. Имеется [[Критерий_Уилкоксона_для_связных_выборок|аналог]] критерия Уилкоксона для связанных повторных наблюдений. |
- | [[Критерий_Уилкоксона-Манна-Уитни|U-критерий Манна-Уитни]]. Имеется [[Критерий_Уилкоксона_для_связных_выборок|аналог]] критерия Уилкоксона для | + | |
== Пример задачи == | == Пример задачи == | ||
Строка 6: | Строка 5: | ||
== Описание критерия == | == Описание критерия == | ||
- | Заданы две выборки <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>. | + | Заданы две выборки <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R};\; m \le n,</tex> в противном случае следует поменять выборки местами. |
'''Дополнительные предположения:''' | '''Дополнительные предположения:''' | ||
Строка 14: | Строка 13: | ||
'''Статистика критерия:''' | '''Статистика критерия:''' | ||
+ | # Построить общий вариационный ряд объединённой выборки <tex>x^{(1)} \leq \cdots \leq x^{(m+n)}</tex> и найти ранги <tex>r(x_i),\; r(y_i)</tex> всех элементов обеих выборок в общем вариационном ряду. | ||
+ | # Рассчитать суммы рангов, соответствующих обеим выборкам: | ||
+ | : <tex>R_x = \sum_{i=1}^m r(x_i);</tex> | ||
+ | : <tex>R_y = \sum_{i=1}^n r(y_i);</tex> | ||
+ | # Если размеры выборок совпадают (<tex>m=n</tex>), то значение статистики <tex>W</tex> будет равняется одной из сумм рангов <tex>R_x</tex> или <tex>R_y</tex> (любой). | ||
+ | |||
+ | '''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>): | ||
+ | |||
+ | * против альтернативы <tex>H_1:\;</tex> ???? | ||
+ | |||
+ | :если <tex>W \notin \left[ W_{\alpha/2},\,W_{1-\alpha/2} \right]</tex> , то нулевая гипотеза отвергается. Здесь <tex>W_{\alpha}</tex> есть <tex>\alpha</tex>-квантиль табличного распределения Уилкоксона с параметрами <tex>m,\,n</tex>. | ||
+ | |||
+ | '''Асимптотический критерий''': | ||
+ | |||
+ | Рассмотрим нормированную и центрированную статистика Уилкоксона: | ||
+ | |||
+ | :<tex>T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}</tex>; | ||
+ | |||
+ | <tex>T</tex> асимптотически имеет стандартное нормальное распределение при <tex>N \ge 20</tex>. | ||
+ | |||
+ | При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее: | ||
+ | |||
+ | :<tex>\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},</tex> | ||
+ | |||
+ | :где <tex>g</tex> - количество связок, <tex>t_1, \ldots, t_g</tex> - их размеры. | ||
+ | |||
== Свойства и границы применимости критерия == | == Свойства и границы применимости критерия == | ||
Строка 24: | Строка 49: | ||
== Ссылки == | == Ссылки == | ||
- | * [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез. | + | * [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез. |
- | + |
Версия 22:14, 11 декабря 2009
Критерий Уилкоксона двухвыборочный — непараметрический статистический критерий, используемый для проверки гипотезы о равенстве средних двух независимых выборок. Выборки взяты из закона распределения, отличного от нормального, либо данные измерены с использованием нечисловой шкалы. Метод следует использовать, когда нет информации о дисперсии выборок. В случае равных дисперсий следует применять более мощный U-критерий Манна-Уитни. Имеется аналог критерия Уилкоксона для связанных повторных наблюдений.
Содержание |
Пример задачи
Описание критерия
Заданы две выборки в противном случае следует поменять выборки местами.
Дополнительные предположения:
- обе выборки простые, объединённая выборка независима;
Нулевая гипотеза обе выборки имеют одинаковое распеределение, то есть извлечены из одной генеральной совокупности. Следствием этого является равенство средних.
Статистика критерия:
- Построить общий вариационный ряд объединённой выборки и найти ранги всех элементов обеих выборок в общем вариационном ряду.
- Рассчитать суммы рангов, соответствующих обеим выборкам:
- Если размеры выборок совпадают (), то значение статистики будет равняется одной из сумм рангов или (любой).
Критерий (при уровне значимости ):
- против альтернативы ????
- если , то нулевая гипотеза отвергается. Здесь есть -квантиль табличного распределения Уилкоксона с параметрами .
Асимптотический критерий:
Рассмотрим нормированную и центрированную статистика Уилкоксона:
- ;
асимптотически имеет стандартное нормальное распределение при .
При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:
- где - количество связок, - их размеры.
Свойства и границы применимости критерия
История
Литература
- Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003. — 204-209 с.
- Лапач С. Н. , Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 160-164 с.
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.