Критерий Уилкоксона-Манна-Уитни
Материал из MachineLearning.
Vokov (Обсуждение | вклад)
(Новая: '''U-критерий Манна-Уитни''' (Mann-Whitney U test) — непараметрический статистический критерий, используемый д...)
К следующему изменению →
Версия 19:03, 14 августа 2008
U-критерий Манна-Уитни (Mann-Whitney U test) — непараметрический статистический критерий, используемый для оценки различий между двумя выборками по признаку, измеренному в количественной или порядковой шкале.
Другие названия: критерий Манна-Уитни-Уилкоксона (Mann-Whitney-Wilcoxon, MWW), критерий суммы рангов Уилкоксона (Wilcoxon rank-sum test) или критерий Уилкоксона-Манна-Уитни (Wilcoxon-Mann-Whitney test, WMW).
Критерий часто применяется для проверки равенства средних в двух выборках (отрицание этого предположения называют гипотезой сдвига). Однако, строго говоря, U-критерий проверяет нулевую гипотезу об однородности, то есть гипотезу, что две выборки одинаково распределены. Это более сильное предположение. С другой стороны, U-критерий гораздо более чувствителен к различию средних, чем к различию дисперсий или других характеристик распределения выборок. Для проверки однородности следует пользоваться более мощными критериями.
Критерий Манна-Уитни является непараметрическим аналогом критерия Стьюдента. Если выборки нормальные, то предпочтительно применить более мощный критерий Стьюдента.
Содержание |
Примеры задач
Пример 1. Первая выборка — это пациенты, которых лечили препаратом А. Вторая выборка — пациенты, которых лечили препаратом Б. Значения в выборках — это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.
Пример 2. Первая выборка — это поля, обработанные агротехническим методом А. Вторая выборка — поля, обработанные агротехническим методом Б. Значения в выборках — это урожайность. Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.
Пример 3. Первая выборка — это дни, когда в супермаркете проходила промо-акция типа А (красные ценники со скидкой). Вторая выборка — дни промо-акции типа Б (каждая пятая пачка бесплатно). Значения в выборках — это показатель эффективности промо-акции (объём продаж, либо выручка в рублях). Требуется выяснить, какой из типов промо-акции более эффективен.
Описание критерия
Заданы две выборки .
Дополнительные предположения:
- обе выборки простые;
- обе выборки взяты из непрерывных распределений.
Нулевая гипотеза две выборки взяты из одного и того же распределения.
Статистика критерия:
- Построить общий вариационный ряд объединённой выборки и найти ранги всех элементов обеих выборок в общем вариационном ряду.
- Вычислить средние ранги обеих выборок и статистику :
Замечание: менее рациональный способ вычисления статистик :
Критерий (при уровне значимости ):
- против альтернативы
- если или , то нулевая гипотеза отвергается;
- против альтернативы
- если , то нулевая гипотеза отвергается;
- против альтернативы
- если , то нулевая гипотеза отвергается;
где есть -квантиль табличного распределения Уилкоксона-Манна-Уитни с параметрами .
Асимптотический критерий при :
- асимптотически имеет стандартное нормальное распределение.
История
Данный метод выявления различий между выборками был предложен в 1945 году Френком Уилкоксоном. В 1947 году он был существенно переработан и расширен Манном и Уитни, по именам которых сегодня обычно и называется.
Литература
- Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. — 1947, №18. — Pp. 50-60.
- Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. 1945. — Pp. 80–83.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Статистика (функция выборки)
- Критерий Стьюдента
- Mann-Whitney U (Wikipedia).
- U-критерий Манна-Уитни (Википедия).
- Таблица критических значений U-критерия Манна-Уитни
- Critical Values for the Mann-Whitney U-Test.