Участник:Василий Ломакин/Критерий Уилкоксона для связных выборок
Материал из MachineLearning.
Строка 1: | Строка 1: | ||
+ | {{TOCright}} | ||
+ | |||
+ | |||
TODO: | TODO: | ||
# Пример | # Пример | ||
- | |||
- | |||
- | |||
# Дополнительные предположения | # Дополнительные предположения | ||
# Ссылка на что такое связки | # Ссылка на что такое связки | ||
Строка 13: | Строка 13: | ||
== Пример задачи == | == Пример задачи == | ||
- | + | Первая выборка - температура пациентов до начала лечения. Вторая - температура в точности этих же пациентов после введения лекарства. Требуется выяснить, повлияло ли применение лекарства на температуру больных. Выборки '''связные''', измерены в [[Теория измерений|порядковой шкале]]. | |
== Описание критерия == | == Описание критерия == | ||
Строка 34: | Строка 34: | ||
Против альтернативы <tex>H_1:\; \mathbb{P} \{ x_i < y_i \} \neq 1/2</tex>: | Против альтернативы <tex>H_1:\; \mathbb{P} \{ x_i < y_i \} \neq 1/2</tex>: | ||
- | : если <tex>R</tex> больше табличного значения критерия знаковых рангов Уилкоксона <tex>T^{+}</tex> с уровнем значимости <tex>\alpha/2</tex> и числом степеней свободы <tex>N</tex>, то нулевая гипотеза отвергается. | + | : если <tex>R</tex> больше табличного значения критерия знаковых рангов Уилкоксона <tex>T^{+}</tex><ref>Лапач С. Н. Статистика в науке и бизнесе. — 529 с.</ref> с уровнем значимости <tex>\alpha/2</tex> и числом степеней свободы <tex>N</tex>, то нулевая гипотеза отвергается. |
'''Асимптотический критерий''': | '''Асимптотический критерий''': | ||
Строка 46: | Строка 46: | ||
При наличии связок необходимо учесть их с помощью поправки. Выражение в знаменателе необходимо заменить на следующее: | При наличии связок необходимо учесть их с помощью поправки. Выражение в знаменателе необходимо заменить на следующее: | ||
- | :<tex>\left{ \frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24} \right}^{1/2},</tex> | + | :<tex>\left{ \frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24} \right}^{1/2},</tex><ref>Лапач С. Н. Статистика в науке и бизнесе. — 156 с.</ref> |
- | :где <tex>g</tex> - количество связок, <tex>t_1, \ldots, t_g</tex> - их размеры. | + | :где <tex>g</tex> - количество связок, <tex>t_1, \ldots, t_g</tex> - их размеры. Для элементов связок вычисляется средний ранг. |
'''Другие гипотезы''': | '''Другие гипотезы''': | ||
Строка 58: | Строка 58: | ||
В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме. | В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме. | ||
- | == | + | == Применение критерия == |
- | + | Метод часто используется для сравнения показателей выборки до и после эксперимента, в частности для проверки гипотезы о равенстве медиан в двух зависимых выборках. Вообще говоря, можно строить примеры, когда медианы выборок различны, а гипотеза H_0 верна, поэтому применять критерий для проверки такой гипотезы следует с осторожностью. Аналогичными недостатками (в своей области применения) обладают [[Критерий Уилкоксона двухвыборочный|двухвыборочный критерий Вилкоксона]] и [[Критерий_Уилкоксона-Манна-Уитни|U-критерий Манна-Уитни]].<ref>Орлов А. И. Эконометрика. — §4.5.</ref> | |
+ | |||
+ | Критерий является аналогом [[Критерий Стьюдента|t-критерия Стьюдента для связанных выборок]] в случае распределения, отличного от нормального, либо данных, измеренных в количественной шкале. К нормально распределённым совокупностям следует применять более мощный t-критерий. | ||
== История == | == История == | ||
Строка 70: | Строка 72: | ||
# ''Лапач С. Н., Чубенко А. В., Бабич П. Н.'' Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с. | # ''Лапач С. Н., Чубенко А. В., Бабич П. Н.'' Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с. | ||
# ''Кобзарь А. И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. — 457-458 с. | # ''Кобзарь А. И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. — 457-458 с. | ||
+ | # ''Орлов А. И.'' Эконометрика. — М.: Экзамен, 2003. — §4.5. | ||
+ | # ''Лагутин М. Б.'' Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003. — 222-227 с. | ||
== Ссылки == | == Ссылки == | ||
* [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез. | * [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез. | ||
- | * [[Критерий Уилкоксона | + | * [[Критерий Уилкоксона двухвыборочный]] |
* [http://en.wikipedia.org/wiki/Wilcoxon_signed-rank_test Wilcoxon signed-rank test] (Wikipedia). | * [http://en.wikipedia.org/wiki/Wilcoxon_signed-rank_test Wilcoxon signed-rank test] (Wikipedia). |
Версия 21:51, 24 декабря 2009
|
TODO:
- Пример
- Дополнительные предположения
- Ссылка на что такое связки
- Иллюстрации - критическая область, мощность и т.п.
- Вычисление рангов для связок
Критерий Уилкоксона (Вилкоксона) для связных выборок (Wilcoxon signed-rank test) — непараметрический статистический критерий, применяемый для оценки различий между двумя зависимыми выборками, взятыми из закона распределения, отличного от нормального, либо измеренными с использованием порядковой шкалы. Критерий является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.
Пример задачи
Первая выборка - температура пациентов до начала лечения. Вторая - температура в точности этих же пациентов после введения лекарства. Требуется выяснить, повлияло ли применение лекарства на температуру больных. Выборки связные, измерены в порядковой шкале.
Описание критерия
Заданы две выборки .
Дополнительные предположения:
- Обе выборки простые.
- Выборки связные, то есть элементы соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).
Вычисление статистики критерия:
- Рассчитать значения разностей пар двух выборок. Нулевые разности далее не учитываются. - количество ненулевых разностей.
- Проранжировать модули разностей пар в возрастающем порядке.
- Приписать рангам знаки соответствующих им разностей.
- Рассчитать сумму положительных рангов.
Критерий (при уровне значимости ):
Против альтернативы :
- если больше табличного значения критерия знаковых рангов Уилкоксона [1] с уровнем значимости и числом степеней свободы , то нулевая гипотеза отвергается.
Асимптотический критерий:
Рассмотрим нормированную и центрированную статистика Уилкоксона:
- ;
асимптотически имеет стандартное нормальное распределение. Аппроксимация начинает работать при .
При наличии связок необходимо учесть их с помощью поправки. Выражение в знаменателе необходимо заменить на следующее:
- где - количество связок, - их размеры. Для элементов связок вычисляется средний ранг.
Другие гипотезы:
средняя разница между значениями пар двух выборок равна заданной константе A.
средняя разница не равна A.
В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме.
Применение критерия
Метод часто используется для сравнения показателей выборки до и после эксперимента, в частности для проверки гипотезы о равенстве медиан в двух зависимых выборках. Вообще говоря, можно строить примеры, когда медианы выборок различны, а гипотеза H_0 верна, поэтому применять критерий для проверки такой гипотезы следует с осторожностью. Аналогичными недостатками (в своей области применения) обладают двухвыборочный критерий Вилкоксона и U-критерий Манна-Уитни.[3]
Критерий является аналогом t-критерия Стьюдента для связанных выборок в случае распределения, отличного от нормального, либо данных, измеренных в количественной шкале. К нормально распределённым совокупностям следует применять более мощный t-критерий.
История
Данный критерий назван именем Френка Уилкоксона (1892-1965). Статья, выпущенная им в 1945 году, содержала также описание аналогичного метода для случая независимых выборок.
Примечания
- ↑ Лапач С. Н. Статистика в науке и бизнесе. — 529 с.
- ↑ Лапач С. Н. Статистика в науке и бизнесе. — 156 с.
- ↑ Орлов А. И. Эконометрика. — §4.5.
Литература
- Лапач С. Н., Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 457-458 с.
- Орлов А. И. Эконометрика. — М.: Экзамен, 2003. — §4.5.
- Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003. — 222-227 с.
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Критерий Уилкоксона двухвыборочный
- Wilcoxon signed-rank test (Wikipedia).