Участник:Василий Ломакин/Критерий Уилкоксона для связных выборок

Материал из MachineLearning.

< Участник:Василий Ломакин

Версия от 21:51, 24 декабря 2009; Василий Ломакин (Обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

Перейти к: навигация, поиск

Содержание

1 Пример задачи
2 Описание критерия
3 Применение критерия
4 История
5 Примечания
6 Литература
7 Ссылки

TODO:

Пример
Дополнительные предположения
Ссылка на что такое связки
Иллюстрации - критическая область, мощность и т.п.
Вычисление рангов для связок

Критерий Уилкоксона (Вилкоксона) для связных выборок (Wilcoxon signed-rank test) — непараметрический статистический критерий, применяемый для оценки различий между двумя зависимыми выборками, взятыми из закона распределения, отличного от нормального, либо измеренными с использованием порядковой шкалы. Критерий является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Пример задачи

Первая выборка - температура пациентов до начала лечения. Вторая - температура в точности этих же пациентов после введения лекарства. Требуется выяснить, повлияло ли применение лекарства на температуру больных. Выборки связные, измерены в порядковой шкале.

Описание критерия

Заданы две выборки $x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}$ .

Дополнительные предположения:

Обе выборки простые.
Выборки связные, то есть элементы $x_i,\: y_i$ соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).

Нулевая гипотеза $H_0:\; \mathbb{P} \{x_i < y_i \} = 1/2$ .

Вычисление статистики критерия:

Рассчитать значения разностей пар двух выборок. Нулевые разности далее не учитываются. $N$ - количество ненулевых разностей.
Проранжировать модули разностей пар в возрастающем порядке.
Приписать рангам знаки соответствующих им разностей.
Рассчитать сумму $R$ положительных рангов.

Критерий (при уровне значимости $\alpha$ ):

Против альтернативы $H_1:\; \mathbb{P} \{ x_i < y_i \} \neq 1/2$ :

если $R$ больше табличного значения критерия знаковых рангов Уилкоксона $T^{+}$ ^[1] с уровнем значимости $\alpha/2$ и числом степеней свободы $N$ , то нулевая гипотеза отвергается.

Асимптотический критерий:

Рассмотрим нормированную и центрированную статистика Уилкоксона:

$\tilde T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}$ ;

$\tilde T$ асимптотически имеет стандартное нормальное распределение. Аппроксимация начинает работать при $N \ge 20$ .

При наличии связок необходимо учесть их с помощью поправки. Выражение в знаменателе необходимо заменить на следующее:

$\left{ \frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24} \right}^{1/2},$ ^[2]

где $g$ - количество связок, $t_1, \ldots, t_g$ - их размеры. Для элементов связок вычисляется средний ранг.

Другие гипотезы:

$H_0:\;$ средняя разница между значениями пар двух выборок равна заданной константе A.

$H_1:\;$ средняя разница не равна A.

В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме.

Применение критерия

Метод часто используется для сравнения показателей выборки до и после эксперимента, в частности для проверки гипотезы о равенстве медиан в двух зависимых выборках. Вообще говоря, можно строить примеры, когда медианы выборок различны, а гипотеза H_0 верна, поэтому применять критерий для проверки такой гипотезы следует с осторожностью. Аналогичными недостатками (в своей области применения) обладают двухвыборочный критерий Вилкоксона и U-критерий Манна-Уитни.^[3]

Критерий является аналогом t-критерия Стьюдента для связанных выборок в случае распределения, отличного от нормального, либо данных, измеренных в количественной шкале. К нормально распределённым совокупностям следует применять более мощный t-критерий.

История

Данный критерий назван именем Френка Уилкоксона (1892-1965). Статья, выпущенная им в 1945 году, содержала также описание аналогичного метода для случая независимых выборок.

Примечания

↑ Лапач С. Н. Статистика в науке и бизнесе. — 529 с.
↑ Лапач С. Н. Статистика в науке и бизнесе. — 156 с.
↑ Орлов А. И. Эконометрика. — §4.5.

Литература

Лапач С. Н., Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с.
Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 457-458 с.
Орлов А. И. Эконометрика. — М.: Экзамен, 2003. — §4.5.
Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003. — 222-227 с.

Ссылки

Проверка статистических гипотез — о методологии проверки статистических гипотез.
Критерий Уилкоксона двухвыборочный
Wilcoxon signed-rank test (Wikipedia).

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:%D0%92%D0%B0%D1%81%D0%B8%D0%BB%D0%B8%D0%B9_%D0%9B%D0%BE%D0%BC%D0%B0%D0%BA%D0%B8%D0%BD/%D0%9A%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9_%D0%A3%D0%B8%D0%BB%D0%BA%D0%BE%D0%BA%D1%81%D0%BE%D0%BD%D0%B0_%D0%B4%D0%BB%D1%8F_%D1%81%D0%B2%D1%8F%D0%B7%D0%BD%D1%8B%D1%85_%D0%B2%D1%8B%D0%B1%D0%BE%D1%80%D0%BE%D0%BA»

Участник:Василий Ломакин/Критерий Уилкоксона для связных выборок

Материал из MachineLearning.

Содержание

Пример задачи

Описание критерия

Применение критерия

История

Примечания

Литература

Ссылки

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты