Критерий Зигеля-Тьюки
Материал из MachineLearning.
(→Ссылки) |
|||
(6 промежуточных версий не показаны.) | |||
Строка 1: | Строка 1: | ||
'''Критерий Зигеля-Тьюки''' является ранговым критерием, предназначенным для проверки принадлежности двух независимых выборок | '''Критерий Зигеля-Тьюки''' является ранговым критерием, предназначенным для проверки принадлежности двух независимых выборок | ||
к общей генеральной совокупности с одинаковыми характеристиками рассеяния. | к общей генеральной совокупности с одинаковыми характеристиками рассеяния. | ||
+ | |||
+ | ==Примеры задач== | ||
+ | Пусть на некотором предприятии два подразделения выполняют одну и ту же работу, но на оборудовании различных производителей. | ||
+ | Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения. | ||
+ | Каждое значение в выборке - это числовая оценка производительности данного рабочего. | ||
+ | Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием другого производителя. | ||
+ | |||
+ | Другой пример: предположим, существует два альтернативных агротехнических метода обработки полей. | ||
+ | Для каждого такого метода составим выборку из обработанных им полей. | ||
+ | Значение в выборке равно урожайности данного поля. | ||
+ | Требуется найти наиболее эффективный метод. | ||
==Описание критерия== | ==Описание критерия== | ||
Даны две выборки: <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>. | Даны две выборки: <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>. | ||
- | Через <tex>H_0</tex> обозначим гипотезу | + | Через <tex>H_0</tex> обозначим следующую гипотезу: разброс <tex>x^m</tex> и <tex>y^n</tex> одинаков. |
Составим объединённую упорядоченную выборку | Составим объединённую упорядоченную выборку | ||
::<tex>z_1,z_2,\dots,z_{m+n}</tex> | ::<tex>z_1,z_2,\dots,z_{m+n}</tex> | ||
Строка 11: | Строка 22: | ||
т.е. оставшийся ряд "переворачивается" после приписывания рангов очередной паре крайних значений. | т.е. оставшийся ряд "переворачивается" после приписывания рангов очередной паре крайних значений. | ||
Ранги, присвоенные в этой последовательности элементам проверяемых выборок, обозначим через <tex>r(x_i), r(y_j)</tex>. | Ранги, присвоенные в этой последовательности элементам проверяемых выборок, обозначим через <tex>r(x_i), r(y_j)</tex>. | ||
- | Вычислим теперь статистику Манна-Уитни | + | Вычислим теперь статистику Манна-Уитни: |
::<tex>R_x = \sum_{i=1}^m r(x_i);\;\;\;\; U_x = mn + \frac12m(m+1) - R_x;</tex> | ::<tex>R_x = \sum_{i=1}^m r(x_i);\;\;\;\; U_x = mn + \frac12m(m+1) - R_x;</tex> | ||
::<tex>R_y = \sum_{i=1}^n r(y_i);\;\;\;\; U_y = mn + \frac12n(n+1) - R_y;</tex> | ::<tex>R_y = \sum_{i=1}^n r(y_i);\;\;\;\; U_y = mn + \frac12n(n+1) - R_y;</tex> | ||
+ | ::<tex>U = \min\left\{U_x,U_y\right\}.</tex>. | ||
+ | Гипотеза <tex>H_0</tex> принимается, если <tex>U \notin \left[ U_{\alpha/2},\, U_{1-\alpha/2} \right] </tex>, | ||
+ | где <tex>U_{\alpha}</tex> есть <tex>\alpha</tex>-квантиль табличного распределения Уилкоксона-Манна-Уитни с параметрами <tex>m,\,n</tex>. | ||
==Литература== | ==Литература== | ||
Строка 24: | Строка 38: | ||
==Ссылки== | ==Ссылки== | ||
- | *[http://en.wikipedia.org/wiki/Siegel-Tukey_test Siegel-Tukey test](Wikipedia) | + | * [http://en.wikipedia.org/wiki/Siegel-Tukey_test Siegel-Tukey test](Wikipedia) |
+ | * [http://ami.nstu.ru/~headrd/seminar/publik_html/Homogeneity_variance_2.pdf О применении и мощности непараметрических критериев однородности характеристик рассеяния (Ансари-Бредли, Муда, Сижела-Тьюки, Кейпена и Клотца) на сайте Новосибирского государственного технического университета] | ||
[[Категория:Прикладная статистика]] | [[Категория:Прикладная статистика]] | ||
+ | [[Категория:Непараметрические статистические тесты]] |
Текущая версия
Критерий Зигеля-Тьюки является ранговым критерием, предназначенным для проверки принадлежности двух независимых выборок к общей генеральной совокупности с одинаковыми характеристиками рассеяния.
Содержание |
Примеры задач
Пусть на некотором предприятии два подразделения выполняют одну и ту же работу, но на оборудовании различных производителей. Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения. Каждое значение в выборке - это числовая оценка производительности данного рабочего. Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием другого производителя.
Другой пример: предположим, существует два альтернативных агротехнических метода обработки полей. Для каждого такого метода составим выборку из обработанных им полей. Значение в выборке равно урожайности данного поля. Требуется найти наиболее эффективный метод.
Описание критерия
Даны две выборки: . Через обозначим следующую гипотезу: разброс и одинаков. Составим объединённую упорядоченную выборку
и составим из неё новую последовательность вида
- ,
т.е. оставшийся ряд "переворачивается" после приписывания рангов очередной паре крайних значений. Ранги, присвоенные в этой последовательности элементам проверяемых выборок, обозначим через . Вычислим теперь статистику Манна-Уитни:
- .
Гипотеза принимается, если , где есть -квантиль табличного распределения Уилкоксона-Манна-Уитни с параметрами .
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.