Участник:Василий Ломакин/Критерий Уилкоксона для связных выборок
Материал из MachineLearning.
(Различия между версиями)
Строка 8: | Строка 8: | ||
Заданы две выборки <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>. | Заданы две выборки <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>. | ||
- | '''Дополнительные предположения:''' | + | '''Дополнительные предположения:''' |
+ | * связанные выборки | ||
+ | * ещё что-то | ||
'''[[Нулевая гипотеза]]''' <tex>H_0:\; \mathbb{P} \{x_i-y_i < 0 \} = 1/2</tex>. | '''[[Нулевая гипотеза]]''' <tex>H_0:\; \mathbb{P} \{x_i-y_i < 0 \} = 1/2</tex>. | ||
'''Статистика критерия:''' | '''Статистика критерия:''' | ||
- | # Рассчитать значения разностей двух выборок. Нулевые разности далее не учитываются. <tex>N</tex> - количество ненулевых разностей. | + | # Рассчитать значения разностей пар двух выборок. Нулевые разности далее не учитываются. <tex>N</tex> - количество ненулевых разностей. |
# Проранжировать модули разностей пар в возрастающем порядке. | # Проранжировать модули разностей пар в возрастающем порядке. | ||
# Приписать рангам знаки соответствующих им разностей. | # Приписать рангам знаки соответствующих им разностей. | ||
# Рассчитать сумму <tex>R</tex> положительных рангов. | # Рассчитать сумму <tex>R</tex> положительных рангов. | ||
- | |||
- | |||
- | + | '''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>): | |
- | + | Против альтернативы <tex>H_1:\; \mathbb{P} \{ x_i-y_i \} \neq 1/2</tex>: | |
- | : | + | : если <tex>R</tex> больше табличного значения критерия знаковых рангов Уилкоксона <tex>T^{+}</tex> с уровнем значимости <tex>\alpha/2</tex> и числом степеней свободы <tex>N</tex>, то нулевая гипотеза отвергается. |
- | + | '''Асимптотический критерий''': | |
- | == | + | Рассмотрим нормированную и центрированную статистика Уилкоксона: |
+ | : <tex>T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}</tex>; | ||
+ | :<tex>T</tex> асимптотически имеет стандартное нормальное распределение при <tex>N \ge 20</tex> | ||
+ | |||
+ | :При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее: | ||
+ | |||
+ | :<tex>\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},</tex> | ||
+ | :где <tex>g</tex> - количество связок, <tex>t_1, \ldots, t_g</tex> - их размеры. | ||
+ | |||
+ | '''Другие гипотезы''': | ||
+ | <tex>H_0:\; </tex> средняя разница между значениями пар двух выборок равна заданной константе A. | ||
+ | <tex>H_1:\; </tex> средняя разница не равна A. | ||
+ | |||
+ | В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме. | ||
+ | |||
+ | |||
+ | == Свойства и границы применимости критерия == | ||
== Литература == | == Литература == | ||
- | + | # ''Лапач С. Н., Чубенко А. В., Бабич П. Н.'' Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с. | |
- | # ''Лапач С. Н. , Чубенко А. В., Бабич П. Н.'' Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с. | + | # ''Кобзарь А. И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. — 457-458 с. |
== Ссылки == | == Ссылки == | ||
* [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез. | * [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез. | ||
* [[Статистика (функция выборки)]] | * [[Статистика (функция выборки)]] |
Версия 18:26, 11 декабря 2009
Критерий Уилкоксона для связных выборок — непараметрический статистический критерий. Аналог t-критерия для парных наблюдений в случае закона распределения, отличного от нормального, либо данных в нечисловой шкале. Применяется для связанных пар наблюдений.
Содержание |
Пример задачи
Описание критерия
Заданы две выборки .
Дополнительные предположения:
- связанные выборки
- ещё что-то
Статистика критерия:
- Рассчитать значения разностей пар двух выборок. Нулевые разности далее не учитываются. - количество ненулевых разностей.
- Проранжировать модули разностей пар в возрастающем порядке.
- Приписать рангам знаки соответствующих им разностей.
- Рассчитать сумму положительных рангов.
Критерий (при уровне значимости ):
Против альтернативы :
- если больше табличного значения критерия знаковых рангов Уилкоксона с уровнем значимости и числом степеней свободы , то нулевая гипотеза отвергается.
Асимптотический критерий:
Рассмотрим нормированную и центрированную статистика Уилкоксона:
- ;
- асимптотически имеет стандартное нормальное распределение при
- При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:
- где - количество связок, - их размеры.
Другие гипотезы: средняя разница между значениями пар двух выборок равна заданной константе A. средняя разница не равна A.
В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме.
Свойства и границы применимости критерия
Литература
- Лапач С. Н., Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 457-458 с.
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Статистика (функция выборки)