Участник:Василий Ломакин/Критерий Уилкоксона для связных выборок
Материал из MachineLearning.
Строка 1: | Строка 1: | ||
+ | TODO: | ||
+ | # Пример | ||
+ | # Критерий для коротких выборок | ||
+ | # Свойства и границы применимости критерия | ||
+ | # Всё ли я извлёк из обоих книг? | ||
+ | # Ссылки на англоязычную литературу | ||
+ | # Дополнительные предположения | ||
+ | # Ссылка на что такое связки | ||
+ | |||
'''Критерий Уилкоксона для связных выборок''' — [[непараметрический статистический критерий]], применяющийся для связанных пар наблюдений. Наиболее часто используется для проверки гипотезы о равенстве средних в двух зависимых выборках. Является аналогом соответствующего [[Критерий_Стьюдента|t-критерия Стьюдента для парных наблюдений]] в случае закона распределения, отличного от нормального, либо для данных в нечисловой шкале. | '''Критерий Уилкоксона для связных выборок''' — [[непараметрический статистический критерий]], применяющийся для связанных пар наблюдений. Наиболее часто используется для проверки гипотезы о равенстве средних в двух зависимых выборках. Является аналогом соответствующего [[Критерий_Стьюдента|t-критерия Стьюдента для парных наблюдений]] в случае закона распределения, отличного от нормального, либо для данных в нечисловой шкале. | ||
Строка 28: | Строка 37: | ||
Рассмотрим нормированную и центрированную статистика Уилкоксона: | Рассмотрим нормированную и центрированную статистика Уилкоксона: | ||
- | <tex>T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}</tex>; | + | |
- | <tex>T</tex> асимптотически имеет стандартное нормальное распределение при <tex>N \ge 20</tex> | + | :<tex>T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}</tex>; |
+ | |||
+ | <tex>T</tex> асимптотически имеет стандартное нормальное распределение при <tex>N \ge 20</tex>. | ||
При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее: | При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее: | ||
- | <tex>\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},</tex> | + | :<tex>\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},</tex> |
- | где <tex>g</tex> - количество связок, <tex>t_1, \ldots, t_g</tex> - их размеры. | + | |
+ | :где <tex>g</tex> - количество связок, <tex>t_1, \ldots, t_g</tex> - их размеры. | ||
'''Другие гипотезы''': | '''Другие гипотезы''': | ||
Строка 43: | Строка 55: | ||
В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме. | В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме. | ||
- | |||
== Свойства и границы применимости критерия == | == Свойства и границы применимости критерия == | ||
+ | м? | ||
== Литература == | == Литература == | ||
Строка 53: | Строка 65: | ||
== Ссылки == | == Ссылки == | ||
* [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез. | * [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез. | ||
- | * [[ | + | * [[Критерий Уилкоксона-Манна-Уитни]] |
Версия 18:43, 11 декабря 2009
TODO:
- Пример
- Критерий для коротких выборок
- Свойства и границы применимости критерия
- Всё ли я извлёк из обоих книг?
- Ссылки на англоязычную литературу
- Дополнительные предположения
- Ссылка на что такое связки
Критерий Уилкоксона для связных выборок — непараметрический статистический критерий, применяющийся для связанных пар наблюдений. Наиболее часто используется для проверки гипотезы о равенстве средних в двух зависимых выборках. Является аналогом соответствующего t-критерия Стьюдента для парных наблюдений в случае закона распределения, отличного от нормального, либо для данных в нечисловой шкале.
Содержание |
Пример задачи
Описание критерия
Заданы две выборки .
Дополнительные предположения:
- простые выборки ????
- выборки связные, то есть элементы соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).
Статистика критерия:
- Рассчитать значения разностей пар двух выборок. Нулевые разности далее не учитываются. - количество ненулевых разностей.
- Проранжировать модули разностей пар в возрастающем порядке.
- Приписать рангам знаки соответствующих им разностей.
- Рассчитать сумму положительных рангов.
Критерий (при уровне значимости ):
Против альтернативы :
- если больше табличного значения критерия знаковых рангов Уилкоксона с уровнем значимости и числом степеней свободы , то нулевая гипотеза отвергается.
Асимптотический критерий:
Рассмотрим нормированную и центрированную статистика Уилкоксона:
- ;
асимптотически имеет стандартное нормальное распределение при .
При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:
- где - количество связок, - их размеры.
Другие гипотезы:
средняя разница между значениями пар двух выборок равна заданной константе A.
средняя разница не равна A.
В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме.
Свойства и границы применимости критерия
м?
Литература
- Лапач С. Н., Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 457-458 с.
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Критерий Уилкоксона-Манна-Уитни