Участник:Slimper/Песочница
Материал из MachineLearning.
Строка 33: | Строка 33: | ||
'''Статистика критерия:''' | '''Статистика критерия:''' | ||
- | # Построить общий [[вариационный ряд]] объединённой выборки <tex> | + | # Построить общий [[вариационный ряд]] объединённой выборки <tex>z^{(1)} \leq \cdots \leq z^{(m+n)}</tex> и найти ранги <tex>r(x_i)</tex> элементов первой выборки в общем вариационном ряду. |
- | # | + | # Статистика критерия ван дер Вардена вычисляется по формуле: |
- | + | <tex>X = \sum_{i = 1}^n u( \frac{r(x_i)}{ m + n + 1} )</tex>, где | |
- | + | <tex>u( \frac{r(x_i)}{ m + n + 1} )</tex> — [[квантиль]] | |
- | + | [[стандартное нормальное распределение| стандартного нормального распределения]] | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
'''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>): | '''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>): | ||
+ | * двусторонний критерий — против альтернативы <tex>H_1:\; \mathbb{P} \{ x<y \} \neq 1/2</tex> | ||
+ | ::если <tex> X \notin \left[ X_{\alpha/2},\, X_{1-\alpha/2} \right] </tex>, то нулевая гипотеза отвергается; | ||
- | * против альтернативы <tex> | + | * односторонний критерий -- против альтернативы <tex>H'_1:\; \mathbb{P} \{ x>y \} > 1/2</tex> |
- | ::если <tex> | + | ::если <tex> X_> X_{1-\alpha} </tex>, то нулевая гипотеза отвергается; |
- | + | Здесь <tex> X_{\alpha} </tex> -- это <tex>\alpha</tex>-[[квантиль]] табличного распределения статистики Ван дер Вардена с параметрами <tex>m,\,n</tex>. | |
- | + | ||
- | + | ===Асимптотический критерий === | |
- | + | Распределение статистики Ван дер Вардена асимптотически нормально | |
- | + | с нулевым матожиданием <tex>\mathbb{E}X = 0</tex> и дисперсией | |
- | + | ||
- | + | ::<tex> | |
- | + | \mathbb{D}X = | |
- | ::<tex>\ | + | \frac{mn}{(m + n)(m + n - 1)} |
- | + | \sum_{i = 1}^{m + n} u^2( \frac{i}{m + n + 1} ) | |
+ | </tex> | ||
- | + | Нормальную аппроксимацию статистики Ван дер Вардена можно использовать при | |
+ | <tex> m, n \geqslant 20</tex>. | ||
+ | В этом случае критерии (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>) | ||
+ | будет выглядеть следующим образом: | ||
+ | |||
+ | * двусторонний критерий <tex> \frac{X}{\mathbb{D}X} \notin \left[ u_{\alpha/2},\, u_{1-\alpha/2} \right] </tex>, то нулевая гипотеза отвергается; | ||
+ | |||
+ | * односторонний критерий -- против альтернативы <tex>H'_1:\; \mathbb{P} \{ x>y \} > 1/2</tex> | ||
+ | ::если <tex> \frac{X}{\mathbb{D}X}_> u_{1-\alpha} </tex>, то нулевая гипотеза отвергается; | ||
+ | |||
+ | === Свойства критерия Ван дер Вардена === | ||
+ | Критерий Ван | ||
Иногда ошибочно считают, что U-критерий проверяет нулевую [[гипотеза однородности|гипотезу однородности]] | Иногда ошибочно считают, что U-критерий проверяет нулевую [[гипотеза однородности|гипотезу однородности]] | ||
<tex>H_{00}:\; F(x)=G(y)</tex>, то есть что две выборки взяты из одного и того же распределения. | <tex>H_{00}:\; F(x)=G(y)</tex>, то есть что две выборки взяты из одного и того же распределения. | ||
Строка 82: | Строка 90: | ||
U-критерий является непараметрическим аналогом [[Критерий Стьюдента|критерия Стьюдента]]. | U-критерий является непараметрическим аналогом [[Критерий Стьюдента|критерия Стьюдента]]. | ||
Если [[нормальная выборка|выборки нормальные]], то для проверки гипотезы сдвига предпочтительно применить более мощный критерий Стьюдента. | Если [[нормальная выборка|выборки нормальные]], то для проверки гипотезы сдвига предпочтительно применить более мощный критерий Стьюдента. | ||
+ | |||
+ | === Многомерное обобщение критерия Ван дер Вардена === | ||
== История == | == История == |
Версия 10:30, 6 января 2010
Критерий Ван-дер-Вардена — непараметрический статистический критерий, используемый для оценки различий между двумя выборками по признаку, измеренному в количественной шкале. Критерий является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.
Содержание |
Примеры задач
Пример 1. Первая выборка — это пациенты, которых лечили препаратом А. Вторая выборка — пациенты, которых лечили препаратом Б. Значения в выборках — это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.
Пример 2. Первая выборка — это поля, обработанные агротехническим методом А. Вторая выборка — поля, обработанные агротехническим методом Б. Значения в выборках — это урожайность. Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.
Пример 3. Первая выборка — это дни, когда в супермаркете проходила промо-акция типа А (красные ценники со скидкой). Вторая выборка — дни промо-акции типа Б (каждая пятая пачка бесплатно). Значения в выборках — это показатель эффективности промо-акции (объём продаж, либо выручка в рублях). Требуется выяснить, какой из типов промо-акции более эффективен.
Описание критерия
Заданы две выборки .
Дополнительные предположения:
- обе выборки простые, объединённая выборка независима;
- выборки взяты из неизвестных непрерывных распределений и соответственно.
Статистика критерия:
- Построить общий вариационный ряд объединённой выборки и найти ранги элементов первой выборки в общем вариационном ряду.
- Статистика критерия ван дер Вардена вычисляется по формуле:
, где — квантиль стандартного нормального распределения
Критерий (при уровне значимости ):
- двусторонний критерий — против альтернативы
- если , то нулевая гипотеза отвергается;
- односторонний критерий -- против альтернативы
- если , то нулевая гипотеза отвергается;
Здесь -- это -квантиль табличного распределения статистики Ван дер Вардена с параметрами .
Асимптотический критерий
Распределение статистики Ван дер Вардена асимптотически нормально с нулевым матожиданием и дисперсией
-
Нормальную аппроксимацию статистики Ван дер Вардена можно использовать при .
В этом случае критерии (при уровне значимости ) будет выглядеть следующим образом:
- двусторонний критерий , то нулевая гипотеза отвергается;
- односторонний критерий -- против альтернативы
- если , то нулевая гипотеза отвергается;
Свойства критерия Ван дер Вардена
Критерий Ван Иногда ошибочно считают, что U-критерий проверяет нулевую гипотезу однородности , то есть что две выборки взяты из одного и того же распределения. U-критерий не является состоятельным против общей альтернативы . Это означает, что гипотеза однородности будет приниматься чаще, чем она на самом деле верна. Существуют ситуации, когда гипотеза верна, а более сильная гипотеза однородности не верна [Орлов]. Для проверки однородности существуют более мощные критерии, в частности, критерий Смирнова или критерий Лемана-Розенблатта.
Иногда ошибочно считают, что U-критерий проверяет нулевую гипотезу равенства медиан в двух выборках. Существуют распределения, для которых гипотеза верна, но их медианы различны.
U-критерий можно применять для проверки гипотезы сдвига в качестве альтернативной , где — некоторая константа, отличная от нуля. При этой альтернативе U-критерий является состоятельным. Его целесообразно применять, если одним и тем же прибором проводятся две серии измерений двух значений некоторой физической величины. При этом функция распределения описывает погрешности измерения одного значения, а — другого. Однако во многих приложениях (в частности, эконометрических) нет особых оснований предполагать, что распределение второй выборки лишь сдвигается, но не меняется каким-либо иным образом.
U-критерий является непараметрическим аналогом критерия Стьюдента. Если выборки нормальные, то для проверки гипотезы сдвига предпочтительно применить более мощный критерий Стьюдента.
Многомерное обобщение критерия Ван дер Вардена
История
Критерий был предложен Ван-дер-Варденом в 1953 году
Литература
- ван дер Варден Б.Л. Математическая статистика/Пер.с нем. — М.: Иностранная литература,1960 — 450 c.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
См. также
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Статистика (функция выборки)
- Критерий Стьюдента
Ссылки
Данная статья является непроверенным учебным заданием. - Студент: Участник:Slimper
- Преподаватель: Участник:Vokov
- Срок: 08 января 2010
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.
См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.
-