Критерий Зигеля-Тьюки

Материал из MachineLearning.

(Различия между версиями)

Текущая версия

Критерий Зигеля-Тьюки является ранговым критерием, предназначенным для проверки принадлежности двух независимых выборок к общей генеральной совокупности с одинаковыми характеристиками рассеяния.

Содержание

1 Примеры задач
2 Описание критерия
3 Литература
4 См. также
5 Ссылки

Примеры задач

Пусть на некотором предприятии два подразделения выполняют одну и ту же работу, но на оборудовании различных производителей. Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения. Каждое значение в выборке - это числовая оценка производительности данного рабочего. Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием другого производителя.

Другой пример: предположим, существует два альтернативных агротехнических метода обработки полей. Для каждого такого метода составим выборку из обработанных им полей. Значение в выборке равно урожайности данного поля. Требуется найти наиболее эффективный метод.

Описание критерия

Даны две выборки: $x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}$ . Через $H_0$ обозначим следующую гипотезу: разброс $x^m$ и $y^n$ одинаков. Составим объединённую упорядоченную выборку

$z_1,z_2,\dots,z_{m+n}$

и составим из неё новую последовательность вида

$z_1,z_{m+n},z_{m+n-1},z_2,z_3,z_{m+n-2},\dots$ ,

т.е. оставшийся ряд "переворачивается" после приписывания рангов очередной паре крайних значений. Ранги, присвоенные в этой последовательности элементам проверяемых выборок, обозначим через $r(x_i), r(y_j)$ . Вычислим теперь статистику Манна-Уитни:

$R_x = \sum_{i=1}^m r(x_i);\;\;\;\; U_x = mn + \frac12m(m+1) - R_x;$

$R_y = \sum_{i=1}^n r(y_i);\;\;\;\; U_y = mn + \frac12n(n+1) - R_y;$

$U = \min\left\{U_x,U_y\right\}.$ .

Гипотеза $H_0$ принимается, если $U \notin \left[ U_{\alpha/2},\, U_{1-\alpha/2} \right]$ , где $U_{\alpha}$ есть $\alpha$ -квантиль табличного распределения Уилкоксона-Манна-Уитни с параметрами $m,\,n$ .

Литература

Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.

См. также

Ссылки

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9A%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9_%D0%97%D0%B8%D0%B3%D0%B5%D0%BB%D1%8F-%D0%A2%D1%8C%D1%8E%D0%BA%D0%B8»

Категории: Прикладная статистика | Непараметрические статистические тесты

@@ Строка 1: / Строка 1: @@
 '''Критерий Зигеля-Тьюки''' является ранговым критерием, предназначенным для проверки принадлежности двух независимых выборок
 к общей генеральной совокупности с одинаковыми характеристиками рассеяния.
+==Примеры задач==
+Пусть на некотором предприятии два подразделения выполняют одну и ту же работу, но на оборудовании различных производителей.
+Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения.
+Каждое значение в выборке - это числовая оценка производительности данного рабочего.
+Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием другого производителя.
+Другой пример: предположим, существует два альтернативных агротехнических метода обработки полей.
+Для каждого такого метода составим выборку из обработанных им полей.
+Значение в выборке равно урожайности данного поля.
+Требуется найти наиболее эффективный метод.
 ==Описание критерия==
 Даны две выборки: <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>.
-Через <tex>H_0</tex> обозначим гипотезу о том, что вариации и медианы обеих выборок совпадают.
+Через <tex>H_0</tex> обозначим следующую гипотезу: разброс <tex>x^m</tex> и <tex>y^n</tex> одинаков.
 Составим объединённую упорядоченную выборку
 ::<tex>z_1,z_2,\dots,z_{m+n}</tex>
@@ Строка 11: / Строка 22: @@
 т.е. оставшийся ряд "переворачивается" после приписывания рангов очередной паре крайних значений.
 Ранги, присвоенные в этой последовательности элементам проверяемых выборок, обозначим через <tex>r(x_i), r(y_j)</tex>.
-Вычислим теперь статистику Манна-Уитни обеих выборок:
+Вычислим теперь статистику Манна-Уитни:
 ::<tex>R_x = \sum_{i=1}^m r(x_i);\;\;\;\; U_x = mn + \frac12m(m+1) - R_x;</tex>
 ::<tex>R_y = \sum_{i=1}^n r(y_i);\;\;\;\; U_y = mn + \frac12n(n+1) - R_y;</tex>
+::<tex>U = \min\left\{U_x,U_y\right\}.</tex>.
+Гипотеза <tex>H_0</tex> принимается, если <tex>U \notin \left[ U_{\alpha/2},\, U_{1-\alpha/2} \right] </tex>,
+где <tex>U_{\alpha}</tex> есть <tex>\alpha</tex>-квантиль табличного распределения Уилкоксона-Манна-Уитни с параметрами <tex>m,\,n</tex>.
 ==Литература==
@@ Строка 24: / Строка 38: @@
 ==Ссылки==
-*[http://en.wikipedia.org/wiki/Siegel-Tukey_test Siegel-Tukey test](Wikipedia)
+* [http://en.wikipedia.org/wiki/Siegel-Tukey_test Siegel-Tukey test](Wikipedia)
+* [http://ami.nstu.ru/~headrd/seminar/publik_html/Homogeneity_variance_2.pdf О применении и мощности непараметрических критериев однородности характеристик рассеяния  (Ансари-Бредли, Муда, Сижела-Тьюки, Кейпена и Клотца) на сайте Новосибирского государственного технического университета]
 [[Категория:Прикладная статистика]]
+[[Категория:Непараметрические статистические тесты]]

Критерий Зигеля-Тьюки

Материал из MachineLearning.

Текущая версия

Содержание

Примеры задач

Описание критерия

Литература

См. также

Ссылки

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты