WM-критерий
Материал из MachineLearning.
(→Литература) |
|||
Строка 2: | Строка 2: | ||
'''WM-критерий''' — непараметрический ранговый критерий для проверки принадлежности двух независимых выборок к общей генеральной совокупности с одинаковыми характеристиками рассеяния. В отличие от [[Критерий Зигеля-Тьюки|критерия Зигеля-Тьюки]] не требует предположения о равенстве средних в выборках. | '''WM-критерий''' — непараметрический ранговый критерий для проверки принадлежности двух независимых выборок к общей генеральной совокупности с одинаковыми характеристиками рассеяния. В отличие от [[Критерий Зигеля-Тьюки|критерия Зигеля-Тьюки]] не требует предположения о равенстве средних в выборках. | ||
+ | |||
+ | Коротко, идея метода следующая. По двум выборкам подсчитываются модули разностей значений наблюдений, взятых наугад без возвращения. К получившимся выборкам модулей разностей применяется [[Критерий Уилкоксона-Манна-Уитни|U-критерий Манна-Уитни]] о равенстве медиан. | ||
==Примеры задач== | ==Примеры задач== | ||
Строка 16: | Строка 18: | ||
==Описание критерия== | ==Описание критерия== | ||
+ | Заданы две выборки | ||
+ | ::<tex>X_1^{n_1} = (X_11,\ldots,X_{1n_1}),\; X_{1i} \in \mathbb{R}</tex> | ||
+ | ::<tex>X_2^{n_2} = (X_21,\ldots,X_{2n_2}),\; X_{2i} \in \mathbb{R}</tex>. | ||
+ | |||
+ | **Предположение:** | ||
+ | |||
+ | **Гипотеза:** | ||
+ | |||
+ | Генерируем вспомогательные выборки | ||
+ | ::<tex>D_1^{N_1} = (|X_{1i} - X_{1j}|), \quad N_1 = \lfloor\frac{n_1}{2}\rfloor</tex> | ||
+ | ::<tex>D_2^{N_2} = (|X_{2i} - X_{2j}|), \quad N_2 = \lfloor\frac{n_2}{2}\rfloor</tex> | ||
+ | |||
+ | Алгоритм порождения выборки <tex>D_1</tex> такой: из <tex>X_1</tex> берутся наугад без возвращения пары наблюдений <tex>(X_{1i}, X_{1j})</tex>, в выборку <tex>D_2</tex> добавляется <tex>|X_{1i}-X_{1j}|</tex>, процесс продолжается до тех пор, пока в <tex>X_1</tex> не останется наблюдений, либо останется одно наблюдение. Выборка <tex>D_2</tex> порождается аналогично. | ||
+ | |||
+ | |||
+ | |||
+ | Критерий может быть расширен на случай k выборок за счет использования [[Критерий_Краскела-Уоллиса|критерия Краскела-Уоллиса]] (обобщение U-критерия). | ||
==Литература== | ==Литература== |
Версия 16:46, 18 февраля 2014
WM-критерий — непараметрический ранговый критерий для проверки принадлежности двух независимых выборок к общей генеральной совокупности с одинаковыми характеристиками рассеяния. В отличие от критерия Зигеля-Тьюки не требует предположения о равенстве средних в выборках.
Коротко, идея метода следующая. По двум выборкам подсчитываются модули разностей значений наблюдений, взятых наугад без возвращения. К получившимся выборкам модулей разностей применяется U-критерий Манна-Уитни о равенстве медиан.
Содержание |
Примеры задач
Менеджер по кейтерингу хочет проверить, одинакова ли дисперсия количества соуса в упаковке при расфасовке с помощью двух диспенсеров. Каждым из диспенсеров он наполнил 10 упаковок. Возможно, диспенсеры откалиброваны по-разному (нет требования равенства медиан).
- H0 : дисперсия количества соуса в упаковке не отличается для двух диспенсеров.
- H1 : дисперсия количества соуса в упаковке для двух диспенсеров отличается.
Другой пример: предположим, существует два альтернативных агротехнических метода обработки полей. Для каждого такого метода составим выборку из обработанных им полей. Значение в выборке равно урожайности данного поля. Требуется найти наиболее эффективный метод.
Описание критерия
Заданы две выборки
- .
- Предположение:**
- Гипотеза:**
Генерируем вспомогательные выборки
Алгоритм порождения выборки такой: из берутся наугад без возвращения пары наблюдений , в выборку добавляется , процесс продолжается до тех пор, пока в не останется наблюдений, либо останется одно наблюдение. Выборка порождается аналогично.
Критерий может быть расширен на случай k выборок за счет использования критерия Краскела-Уоллиса (обобщение U-критерия).
Литература
- Clifford Blair, R., & Thompson, G. L. (1992). A distribution-free rank-like test for scale with unequal population locations. Communications in Statistics — Simulation and Computation, 21(2), 353-371.
- Ramsey, P. H., & Ramsey, P. P. (2007). Testing variability in the two-sample case. Communications in Statistics — Simulation and Computation, 36(2), 233-248.