Участник:Василий Ломакин/Критерий Уилкоксона для связных выборок

Материал из MachineLearning.

(Различия между версиями)

Версия 18:36, 11 декабря 2009

Критерий Уилкоксона для связных выборок — непараметрический статистический критерий, применяющийся для связанных пар наблюдений. Наиболее часто используется для проверки гипотезы о равенстве средних в двух зависимых выборках. Является аналогом соответствующего t-критерия Стьюдента для парных наблюдений в случае закона распределения, отличного от нормального, либо для данных в нечисловой шкале.

Содержание

1 Пример задачи
2 Описание критерия
3 Свойства и границы применимости критерия
4 Литература
5 Ссылки

Пример задачи

Описание критерия

Заданы две выборки $x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}$ .

Дополнительные предположения:

простые выборки ????
выборки связные, то есть элементы $x_i,\: y_i$ соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).

Нулевая гипотеза $H_0:\; \mathbb{P} \{x_i-y_i < 0 \} = 1/2$ .

Статистика критерия:

Рассчитать значения разностей пар двух выборок. Нулевые разности далее не учитываются. $N$ - количество ненулевых разностей.
Проранжировать модули разностей пар в возрастающем порядке.
Приписать рангам знаки соответствующих им разностей.
Рассчитать сумму $R$ положительных рангов.

Критерий (при уровне значимости $\alpha$ ):

Против альтернативы $H_1:\; \mathbb{P} \{ x_i-y_i \} \neq 1/2$ :

если $R$ больше табличного значения критерия знаковых рангов Уилкоксона $T^{+}$ с уровнем значимости $\alpha/2$ и числом степеней свободы $N$ , то нулевая гипотеза отвергается.

Асимптотический критерий:

Рассмотрим нормированную и центрированную статистика Уилкоксона: $T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}$ ; $T$ асимптотически имеет стандартное нормальное распределение при $N \ge 20$

При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:

$\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},$ где $g$ - количество связок, $t_1, \ldots, t_g$ - их размеры.

Другие гипотезы:

$H_0:\;$ средняя разница между значениями пар двух выборок равна заданной константе A.

$H_1:\;$ средняя разница не равна A.

В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме.

Свойства и границы применимости критерия

Литература

Лапач С. Н., Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с.
Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 457-458 с.

Ссылки

Проверка статистических гипотез — о методологии проверки статистических гипотез.
Статистика (функция выборки)

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:%D0%92%D0%B0%D1%81%D0%B8%D0%BB%D0%B8%D0%B9_%D0%9B%D0%BE%D0%BC%D0%B0%D0%BA%D0%B8%D0%BD/%D0%9A%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9_%D0%A3%D0%B8%D0%BB%D0%BA%D0%BE%D0%BA%D1%81%D0%BE%D0%BD%D0%B0_%D0%B4%D0%BB%D1%8F_%D1%81%D0%B2%D1%8F%D0%B7%D0%BD%D1%8B%D1%85_%D0%B2%D1%8B%D0%B1%D0%BE%D1%80%D0%BE%D0%BA»

@@ Строка 1: / Строка 1: @@
-'''Критерий Уилкоксона для связных выборок''' — [[непараметрический статистический критерий]]. Аналог t-критерия для парных наблюдений в случае закона распределения, отличного от нормального, либо данных в нечисловой шкале. Применяется для связанных пар наблюдений.
+'''Критерий Уилкоксона для связных выборок''' — [[непараметрический статистический критерий]], применяющийся для связанных пар наблюдений. Наиболее часто используется для проверки гипотезы о равенстве средних в двух зависимых выборках. Является аналогом соответствующего [[Критерий_Стьюдента|t-критерия Стьюдента для парных наблюдений]] в случае закона распределения, отличного от нормального, либо для данных в нечисловой шкале.
 == Пример задачи ==
@@ Строка 9: / Строка 9: @@
 '''Дополнительные предположения:'''
-* связанные выборки
+* простые выборки ????
-* ещё что-то
+* выборки связные, то есть элементы <tex>x_i,\: y_i</tex> соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).
 '''[[Нулевая гипотеза]]''' <tex>H_0:\; \mathbb{P} \{x_i-y_i < 0 \} = 1/2</tex>.
@@ Строка 28: / Строка 28: @@
 Рассмотрим нормированную и центрированную статистика Уилкоксона:
-: <tex>T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}</tex>;
+<tex>T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}</tex>;
-:<tex>T</tex> асимптотически имеет стандартное нормальное распределение при <tex>N \ge 20</tex>
+<tex>T</tex> асимптотически имеет стандартное нормальное распределение при <tex>N \ge 20</tex>
-:При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:
+При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:
-:<tex>\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},</tex>
+<tex>\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},</tex>
-:где <tex>g</tex> - количество связок, <tex>t_1, \ldots, t_g</tex> - их размеры.
+где <tex>g</tex> - количество связок, <tex>t_1, \ldots, t_g</tex> - их размеры.
 '''Другие гипотезы''':
 <tex>H_0:\; </tex> средняя разница между значениями пар двух выборок равна заданной константе A.
 <tex>H_1:\; </tex> средняя разница не равна A.

Участник:Василий Ломакин/Критерий Уилкоксона для связных выборок

Материал из MachineLearning.

Версия 18:36, 11 декабря 2009

Содержание

Пример задачи

Описание критерия

Свойства и границы применимости критерия

Литература

Ссылки

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты