Участник:Василий Ломакин/Критерий Уилкоксона двухвыборочный

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 1: Строка 1:
-
'''Критерий Уилкоксона двухвыборочный''' — [[непараметрический статистический критерий]], используемый для проверки гипотезы о равенстве средних двух независимых выборок. Выборки взяты из закона распределения, отличного от нормального, либо данные измерены с использованием нечисловой шкалы. Метод следует использовать в случае, когда нет информации о дисперсии выборок. В случае равных дисперсий следует применять более мощный [[
+
'''Критерий Уилкоксона двухвыборочный''' — [[непараметрический статистический критерий]], используемый для проверки гипотезы о равенстве средних двух независимых выборок. Выборки взяты из закона распределения, отличного от нормального, либо данные измерены с использованием нечисловой шкалы. Метод следует использовать, когда нет информации о дисперсии выборок. В случае равных дисперсий следует применять более мощный [[Критерий_Уилкоксона-Манна-Уитни|U-критерий Манна-Уитни]]. Имеется [[Критерий_Уилкоксона_для_связных_выборок|аналог]] критерия Уилкоксона для связанных повторных наблюдений.
-
[[Критерий_Уилкоксона-Манна-Уитни|U-критерий Манна-Уитни]]. Имеется [[Критерий_Уилкоксона_для_связных_выборок|аналог]] критерия Уилкоксона для случая связанных наблюдений.
+
== Пример задачи ==
== Пример задачи ==
Строка 6: Строка 5:
== Описание критерия ==
== Описание критерия ==
-
Заданы две выборки <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>.
+
Заданы две выборки <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R};\; m \le n,</tex> в противном случае следует поменять выборки местами.
'''Дополнительные предположения:'''
'''Дополнительные предположения:'''
Строка 14: Строка 13:
'''Статистика критерия:'''
'''Статистика критерия:'''
 +
# Построить общий вариационный ряд объединённой выборки <tex>x^{(1)} \leq \cdots \leq x^{(m+n)}</tex> и найти ранги <tex>r(x_i),\; r(y_i)</tex> всех элементов обеих выборок в общем вариационном ряду.
 +
# Рассчитать суммы рангов, соответствующих обеим выборкам:
 +
: <tex>R_x = \sum_{i=1}^m r(x_i);</tex>
 +
: <tex>R_y = \sum_{i=1}^n r(y_i);</tex>
 +
# Если размеры выборок совпадают (<tex>m=n</tex>), то значение статистики <tex>W</tex> будет равняется одной из сумм рангов <tex>R_x</tex> или <tex>R_y</tex> (любой).
 +
 +
'''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>):
 +
 +
* против альтернативы <tex>H_1:\;</tex> ????
 +
 +
:если <tex>W \notin \left[ W_{\alpha/2},\,W_{1-\alpha/2} \right]</tex> , то нулевая гипотеза отвергается. Здесь <tex>W_{\alpha}</tex> есть <tex>\alpha</tex>-квантиль табличного распределения Уилкоксона с параметрами <tex>m,\,n</tex>.
 +
 +
'''Асимптотический критерий''':
 +
 +
Рассмотрим нормированную и центрированную статистика Уилкоксона:
 +
 +
:<tex>T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}</tex>;
 +
 +
<tex>T</tex> асимптотически имеет стандартное нормальное распределение при <tex>N \ge 20</tex>.
 +
 +
При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:
 +
 +
:<tex>\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},</tex>
 +
 +
:где <tex>g</tex> - количество связок, <tex>t_1, \ldots, t_g</tex> - их размеры.
 +
== Свойства и границы применимости критерия ==
== Свойства и границы применимости критерия ==
Строка 24: Строка 49:
== Ссылки ==
== Ссылки ==
-
* [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез.
+
* [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез.
-
* [[Статистика (функция выборки)]
+

Версия 22:14, 11 декабря 2009

Критерий Уилкоксона двухвыборочныйнепараметрический статистический критерий, используемый для проверки гипотезы о равенстве средних двух независимых выборок. Выборки взяты из закона распределения, отличного от нормального, либо данные измерены с использованием нечисловой шкалы. Метод следует использовать, когда нет информации о дисперсии выборок. В случае равных дисперсий следует применять более мощный U-критерий Манна-Уитни. Имеется аналог критерия Уилкоксона для связанных повторных наблюдений.

Содержание

Пример задачи

Описание критерия

Заданы две выборки x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R};\; m \le n, в противном случае следует поменять выборки местами.

Дополнительные предположения:

Нулевая гипотеза H_0:\; обе выборки имеют одинаковое распеределение, то есть извлечены из одной генеральной совокупности. Следствием этого является равенство средних.

Статистика критерия:

  1. Построить общий вариационный ряд объединённой выборки x^{(1)} \leq \cdots \leq x^{(m+n)} и найти ранги r(x_i),\; r(y_i) всех элементов обеих выборок в общем вариационном ряду.
  2. Рассчитать суммы рангов, соответствующих обеим выборкам:
R_x = \sum_{i=1}^m r(x_i);
R_y = \sum_{i=1}^n r(y_i);
  1. Если размеры выборок совпадают (m=n), то значение статистики W будет равняется одной из сумм рангов R_x или R_y (любой).

Критерий (при уровне значимости \alpha):

  • против альтернативы H_1:\; ????
если W \notin \left[ W_{\alpha/2},\,W_{1-\alpha/2} \right] , то нулевая гипотеза отвергается. Здесь W_{\alpha} есть \alpha-квантиль табличного распределения Уилкоксона с параметрами m,\,n.

Асимптотический критерий:

Рассмотрим нормированную и центрированную статистика Уилкоксона:

T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}};

T асимптотически имеет стандартное нормальное распределение при N \ge 20.

При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:

\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},
где g - количество связок, t_1, \ldots, t_g - их размеры.


Свойства и границы применимости критерия

История

Литература

  1. Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003. — 204-209 с.
  2. Лапач С. Н. , Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 160-164 с.

Ссылки

Личные инструменты