Критерий Зигеля-Тьюки

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Примеры задач)
Текущая версия (11:55, 19 октября 2013) (править) (отменить)
(Ссылки)
 
(1 промежуточная версия не показана)
Строка 15: Строка 15:
==Описание критерия==
==Описание критерия==
Даны две выборки: <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>.
Даны две выборки: <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>.
-
Через <tex>H_0</tex> обозначим следующую гипотезу: <tex>\mathbb{P}\{x<y\}=\frac12</tex>.
+
Через <tex>H_0</tex> обозначим следующую гипотезу: разброс <tex>x^m</tex> и <tex>y^n</tex> одинаков.
Составим объединённую упорядоченную выборку
Составим объединённую упорядоченную выборку
::<tex>z_1,z_2,\dots,z_{m+n}</tex>
::<tex>z_1,z_2,\dots,z_{m+n}</tex>
Строка 38: Строка 38:
==Ссылки==
==Ссылки==
-
*[http://en.wikipedia.org/wiki/Siegel-Tukey_test Siegel-Tukey test](Wikipedia)
+
* [http://en.wikipedia.org/wiki/Siegel-Tukey_test Siegel-Tukey test](Wikipedia)
 +
* [http://ami.nstu.ru/~headrd/seminar/publik_html/Homogeneity_variance_2.pdf О применении и мощности непараметрических критериев однородности характеристик рассеяния (Ансари-Бредли, Муда, Сижела-Тьюки, Кейпена и Клотца) на сайте Новосибирского государственного технического университета]
[[Категория:Прикладная статистика]]
[[Категория:Прикладная статистика]]
[[Категория:Непараметрические статистические тесты]]
[[Категория:Непараметрические статистические тесты]]

Текущая версия

Критерий Зигеля-Тьюки является ранговым критерием, предназначенным для проверки принадлежности двух независимых выборок к общей генеральной совокупности с одинаковыми характеристиками рассеяния.

Содержание

Примеры задач

Пусть на некотором предприятии два подразделения выполняют одну и ту же работу, но на оборудовании различных производителей. Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения. Каждое значение в выборке - это числовая оценка производительности данного рабочего. Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием другого производителя.

Другой пример: предположим, существует два альтернативных агротехнических метода обработки полей. Для каждого такого метода составим выборку из обработанных им полей. Значение в выборке равно урожайности данного поля. Требуется найти наиболее эффективный метод.

Описание критерия

Даны две выборки: x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}. Через H_0 обозначим следующую гипотезу: разброс x^m и y^n одинаков. Составим объединённую упорядоченную выборку

z_1,z_2,\dots,z_{m+n}

и составим из неё новую последовательность вида

z_1,z_{m+n},z_{m+n-1},z_2,z_3,z_{m+n-2},\dots,

т.е. оставшийся ряд "переворачивается" после приписывания рангов очередной паре крайних значений. Ранги, присвоенные в этой последовательности элементам проверяемых выборок, обозначим через r(x_i), r(y_j). Вычислим теперь статистику Манна-Уитни:

R_x = \sum_{i=1}^m r(x_i);\;\;\;\; U_x = mn + \frac12m(m+1) - R_x;
R_y = \sum_{i=1}^n r(y_i);\;\;\;\; U_y = mn + \frac12n(n+1) - R_y;
U = \min\left\{U_x,U_y\right\}..

Гипотеза H_0 принимается, если U \notin \left[ U_{\alpha/2},\, U_{1-\alpha/2} \right] , где U_{\alpha} есть \alpha-квантиль табличного распределения Уилкоксона-Манна-Уитни с параметрами m,\,n.

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.

См. также

Ссылки

Личные инструменты