Участник:Slimper/Песочница
Материал из MachineLearning.
Критерий Ван-дер-Вардена — непараметрический статистический критерий, используемый для оценки различий между двумя выборками по признаку, измеренному в количественной шкале. Критерий является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.
Содержание |
Примеры задач
Пример 1. Первая выборка — это пациенты, которых лечили препаратом А. Вторая выборка — пациенты, которых лечили препаратом Б. Значения в выборках — это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.
Пример 2. Первая выборка — это поля, обработанные агротехническим методом А. Вторая выборка — поля, обработанные агротехническим методом Б. Значения в выборках — это урожайность. Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.
Пример 3. Первая выборка — это дни, когда в супермаркете проходила промо-акция типа А (красные ценники со скидкой). Вторая выборка — дни промо-акции типа Б (каждая пятая пачка бесплатно). Значения в выборках — это показатель эффективности промо-акции (объём продаж, либо выручка в рублях). Требуется выяснить, какой из типов промо-акции более эффективен.
Описание критерия
Заданы две выборки .
Дополнительные предположения:
- обе выборки простые, объединённая выборка независима;
- выборки взяты из неизвестных непрерывных распределений
и
соответственно.
Статистика критерия:
- Построить общий вариационный ряд объединённой выборки
и найти ранги
всех элементов обеих выборок в общем вариационном ряду.
- Вычислить суммарные ранги обеих выборок и статистику Манна-Уитни
:
Замечание: менее рациональный способ вычисления статистик Манна-Уитни :
Критерий (при уровне значимости ):
- против альтернативы
- если
, то нулевая гипотеза отвергается;
- если
- против альтернативы
- если
, то нулевая гипотеза отвергается;
- если
- против альтернативы
- если
, то нулевая гипотеза отвергается;
- если
где
есть
-квантиль табличного распределения Уилкоксона-Манна-Уитни с параметрами
.
Асимптотический критерий: нормированная и центрированная статистика Манна-Уитни
асимптотически имеет стандартное нормальное распределение при .
Свойства и границы применимости U-критерия
Иногда ошибочно считают, что U-критерий проверяет нулевую гипотезу однородности
, то есть что две выборки взяты из одного и того же распределения.
U-критерий не является состоятельным против общей альтернативы
.
Это означает, что гипотеза однородности будет приниматься чаще, чем она на самом деле верна.
Существуют ситуации, когда гипотеза
верна, а более сильная гипотеза однородности
не верна [Орлов].
Для проверки однородности существуют более мощные критерии, в частности, критерий Смирнова или критерий Лемана-Розенблатта.
Иногда ошибочно считают, что U-критерий проверяет нулевую гипотезу равенства медиан в двух выборках.
Существуют распределения, для которых гипотеза верна, но их медианы различны.
U-критерий можно применять для проверки гипотезы сдвига в качестве альтернативной
, где
— некоторая константа, отличная от нуля.
При этой альтернативе U-критерий является состоятельным.
Его целесообразно применять, если одним и тем же прибором проводятся две серии измерений двух значений некоторой физической величины. При этом функция распределения
описывает погрешности измерения одного значения, а
— другого. Однако во многих приложениях (в частности, эконометрических) нет особых оснований предполагать, что распределение второй выборки лишь сдвигается, но не меняется каким-либо иным образом.
U-критерий является непараметрическим аналогом критерия Стьюдента. Если выборки нормальные, то для проверки гипотезы сдвига предпочтительно применить более мощный критерий Стьюдента.
История
Критерий был предложен Ван-дер-Варденом в 1953 году
Литература
- ван дер Варден Б.Л. Математическая статистика/Пер.с нем. — М.: Иностранная литература,1960 — 450 c.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
См. также
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Статистика (функция выборки)
- Критерий Стьюдента
Ссылки
![]() | Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |