Критерий Уилкоксона двухвыборочный

Материал из MachineLearning.

Версия от 21:03, 24 декабря 2009; Василий Ломакин (Обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

Содержание

1 Пример задачи
2 Описание критерия
3 Применение критерия
4 Критерий Вилкоксона и U-критерий Манна-Уитни
5 Примечания
6 Литература
7 Ссылки

Критерий Уилкоксона (Вилкоксона) двухвыборочный — непараметрический статистический критерий, используемый для оценки различий между двумя выборками, взятыми из закона распределения, отличного от нормального, либо измеренными с использованием порядковой шкалы. Имеется аналог критерия Уилкоксона для связанных повторных наблюдений. Критерий является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Пример задачи

Задача - сравнить две методики подготовки роженицы к родам. Сравнивается эффективность по оценке состояния новорожденного в баллах (шкала является порядковой).

Описание критерия

Заданы две выборки $x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R};\; m \le n,$ в противном случае следует поменять выборки местами.

Дополнительное предположение: обе выборки простые, объединённая выборка независима;

Нулевая гипотеза $H_0:\; \mathbb{P} \{ x<y \} = 1/2.$

Вычисление статистики критерия:

Построить общий вариационный ряд объединённой выборки $x^{(1)} \leq \cdots \leq x^{(m+n)}$ и найти ранги $r(x_i),\; r(y_i)$ всех элементов обеих выборок в общем вариационном ряду.
Рассчитать суммы рангов, соответствующих обеим выборкам:
$R_x = \sum_{i=1}^m r(x_i);$
$R_y = \sum_{i=1}^n r(y_i);$
Если размеры выборок совпадают ( $m=n$ ), то значение статистики $W$ будет равняется одной из сумм рангов $R_x$ или $R_y$ (любой). Если же выборки не равны, то $W = R_x$ , то есть сумме рангов, соответствующей меньшей выборке. Заметим, что статистика $W$ линейно связана со статистикой U-критерия Манна-Уитни.

Критерий (при уровне значимости $\alpha$ ):

Против альтернативы $H_1:\; \mathbb{P} \{ x < y \} \neq 1/2$ :

если $W \notin \left[ W_{\alpha/2},\,W_{1-\alpha/2} \right]$ , то нулевая гипотеза отвергается. Здесь $W_{\alpha}$ есть $\alpha$ -квантиль табличного распределения Уилкоксона с параметрами $m,\,n$ . ^[1]^[1]

Асимптотический критерий:

Рассмотрим нормированную и центрированную статистика Уилкоксона:

$\tilde W = \frac{W - \frac{m(m + n + 1)}{2}}{sqrt{\frac{mn(m + n + 1)}{12}}}$ ;

$\tilde W$ асимптотически имеет стандартное нормальное распределение. Нулевая гипотеза (против альтернативы $H_1$ ) отвергается, если $|\tilde W| > \Phi_{1-\alpha/2}$ , где $\Phi_{\alpha}$ есть $\alpha$ -квантиль стандартного нормального распределения.

Приближение можно использовать, если размер хотя бы одной из выборок превышает 25. Если размеры выборок равны, то данная аппроксимация хорошо работает до $m = n = 8$ .^[1]

При наличии связок необходимо учесть их с помощью поправки. Выражение в знаменателе необходимо заменить на следующее:

$\left{ \frac{mn(n+m+1)}{12} \left[ 1 - \frac{\sum^k_{i = 1}t_i(t_i^2-1)}{(n+m)(n+m-1)(n+m+1)} \right] \right}^{1/2},$ ^[1]^[1]

где $k$ - количество только тех связок, в которые входят ранги как одной, так и другой выборок, $t_1, \ldots, t_k$ - их размеры. Совпадения, целиком состоящие из элементов одной и той же выборки, на величину $\tilde W$ не влияют. Наблюдения, не совпадающие с другими, рассматриваются как связки размера 1.

Применение критерия

В биологических и эконометрических приложениях метод часто используется для проверки гипотезы о равенстве средних двух независимых выборок. Вообще говоря, данное использование критерия некорректно. Можно построить примеры, когда $\mathbb{P} \{ x<y \} = 1/2$ , и средние выборок не совпадают.^[1] При этом надо заметить, что данный недостаток не является редкостью, о многих популярных в математической статистике критериях можно сказать, что они не позволяют проверять те гипотезы, с которыми традиционно связаны. При применении подобных критериев к анализу реальных данных необходимо тщательно взвешивать их достоинства и недостатки. ^[1]

Критерий является аналогом критерия t-критерия Стьюдента для независимых выборок в случае закона распределения, отличного от нормального, либо данных, измеренных с использованием порядковой шкалы. Для нормально распределённых совокупностей следует использовать более мощный t-критерий.

Критерий Вилкоксона и U-критерий Манна-Уитни

Статистики критериев Вилкоксона и Вилкоксона-Манна-Уитни линейно связаны, поэтому, по сути, нет смысла говорить о двух различных критериях.^[1] Оба они проверяют одну и ту же гипотезу и их границы применимости также совпадают. В то же время в литературе можно встретить рекомендации использовать критерий Вилкоксона для проверки равенства средних, когда нет предположений о дисперсиях,^[1], а в случае равных дисперсий применять U-критерий Манна-Уитни.^[1]

Проведём эксперимент: будем строить график достигаемого уровня значимости как функцию размера выборок и параметров распределения, усреднённого по нескольким десяткам экспериментов.

графики

Примечания

Литература

Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003. — 204-209 с.
Лапач С. Н. , Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 160-164 с.
Орлов А. И. Эконометрика. — М.: Экзамен, 2003. — 576 с.
Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — §4.5.

Ссылки

Проверка статистических гипотез — о методологии проверки статистических гипотез.
Критерий Уилкоксона-Манна-Уитни
Критерий Уилкоксона для связных выборок

Данная статья является непроверенным учебным заданием.

Студент: Участник:Василий Ломакин

Преподаватель: Участник:Vokov

Срок: 31 декабря 2009

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9A%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9_%D0%A3%D0%B8%D0%BB%D0%BA%D0%BE%D0%BA%D1%81%D0%BE%D0%BD%D0%B0_%D0%B4%D0%B2%D1%83%D1%85%D0%B2%D1%8B%D0%B1%D0%BE%D1%80%D0%BE%D1%87%D0%BD%D1%8B%D0%B9»

Категории: Статистические тесты | Непараметрические статистические тесты | Непроверенные учебные задания

Критерий Уилкоксона двухвыборочный

Материал из MachineLearning.

Содержание

Пример задачи

Описание критерия

Применение критерия

Критерий Вилкоксона и U-критерий Манна-Уитни

Примечания

Литература

Ссылки

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты