Участник:Slimper/Песочница
Материал из MachineLearning.
(→Примеры задач) |
|||
Строка 1: | Строка 1: | ||
'''Критерий Ван дер Вардена(Van der Waerden criteria)''' — [[непараметрический статистический критерий]], используемый для оценки различий между двумя [[выборка]]ми по признаку, измеренному в количественной [[шкала измерения|шкале]]. Критерий является ранговым, поэтому он инвариантен по отношению | '''Критерий Ван дер Вардена(Van der Waerden criteria)''' — [[непараметрический статистический критерий]], используемый для оценки различий между двумя [[выборка]]ми по признаку, измеренному в количественной [[шкала измерения|шкале]]. Критерий является ранговым, поэтому он инвариантен по отношению | ||
к любому монотонному преобразованию шкалы измерения. | к любому монотонному преобразованию шкалы измерения. | ||
- | + | Существует обобщение критерия Ван дер Вардена для выявления различий между несколькими выборками. | |
== Примеры задач == | == Примеры задач == | ||
Строка 17: | Строка 17: | ||
Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами. | Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами. | ||
- | '''Пример 3.( | + | '''Пример 3.(использование многовыборочного критерия Ван дер Вардена)''' |
Нужно проверить, как лекарство помогает в снятии соответствующего симптома. Взяты несколько групп пациентов, и каждой из них назначается определенная доза препарата. Гипотеза состоит в том, что по мере увеличения уровня дозы больные чувствуют себя лучше. | Нужно проверить, как лекарство помогает в снятии соответствующего симптома. Взяты несколько групп пациентов, и каждой из них назначается определенная доза препарата. Гипотеза состоит в том, что по мере увеличения уровня дозы больные чувствуют себя лучше. | ||
Строка 32: | Строка 32: | ||
'''Статистика критерия:''' | '''Статистика критерия:''' | ||
# Построить общий [[вариационный ряд]] объединённой выборки <tex>z^{(1)} \leq \cdots \leq z^{(m+n)}</tex> и найти ранги <tex>r(x_i)</tex> элементов первой выборки в общем вариационном ряду. | # Построить общий [[вариационный ряд]] объединённой выборки <tex>z^{(1)} \leq \cdots \leq z^{(m+n)}</tex> и найти ранги <tex>r(x_i)</tex> элементов первой выборки в общем вариационном ряду. | ||
- | # Статистика критерия | + | # Статистика критерия Ван дер Вардена вычисляется по формуле: |
<tex>X = \sum_{i = 1}^n u( \frac{r(x_i)}{ m + n + 1} )</tex>, где | <tex>X = \sum_{i = 1}^n u( \frac{r(x_i)}{ m + n + 1} )</tex>, где | ||
<tex>u( \frac{r(x_i)}{ m + n + 1} )</tex> — [[квантиль]] уровня | <tex>u( \frac{r(x_i)}{ m + n + 1} )</tex> — [[квантиль]] уровня | ||
Строка 62: | Строка 62: | ||
* односторонний критерий -- против альтернативы <tex>H'_1:\; \mathbb{P} \{ x>y \} > 1/2</tex> | * односторонний критерий -- против альтернативы <tex>H'_1:\; \mathbb{P} \{ x>y \} > 1/2</tex> | ||
- | ::если <tex> \frac{X}{\mathbb{D}X} | + | ::если <tex> \frac{X}{\mathbb{D}X}> u_{1-\alpha} </tex>, то нулевая гипотеза отвергается; |
== Свойства критерия Ван дер Вардена == | == Свойства критерия Ван дер Вардена == | ||
Строка 75: | Строка 75: | ||
Объединённая выборка: <tex>z=x_1^{n_1}\cup x_2^{n_2}\cup \dots \cup x_k^{n_k}</tex>. | Объединённая выборка: <tex>z=x_1^{n_1}\cup x_2^{n_2}\cup \dots \cup x_k^{n_k}</tex>. | ||
- | ''Дополнительные предположения:'' | + | '''Дополнительные предположения:''' |
* все выборки [[Простая выборка|простые]], объединённая выборка [[Независимая выборка|независима]]; | * все выборки [[Простая выборка|простые]], объединённая выборка [[Независимая выборка|независима]]; | ||
* выборки взяты из неизвестных непрерывных распределений <tex>F_1(x),\dots,F_k(x)</tex>. | * выборки взяты из неизвестных непрерывных распределений <tex>F_1(x),\dots,F_k(x)</tex>. | ||
- | + | '''Статистика критерия:''' | |
+ | Все <tex>N=\sum_{i=1}^k n_i</tex> элементов выборок упорядочиваются по возрастанию, через <tex>R_{ij}</tex> обозначается ранг <i>j</i>-го элемента <i>i</i>-й выборки в полученном [[вариационный ряд|вариационном ряду]]. | ||
Статистика Ван дер Вардена имеет вид <br /> | Статистика Ван дер Вардена имеет вид <br /> | ||
Строка 89: | Строка 90: | ||
распределением [[распределение хи-квадрат|хи-квадарат]] с <tex>k - 1</tex> степенью свободы. | распределением [[распределение хи-квадрат|хи-квадарат]] с <tex>k - 1</tex> степенью свободы. | ||
- | Нулевая гипотеза отвергается, если <tex>T > \chi^2_{\alpha, k - 1}</tex>, где | + | Нулевая гипотеза отвергается при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>, если <tex>T > \chi^2_{1 - \alpha, k - 1}</tex>, где |
- | <tex>chi^2_{\alpha, k - 1}</tex> — [[квантиль]] уровня <tex>\alpha</tex> с <tex>k - 1</tex> степенью свободы. | + | <tex>chi^2_{1 - \alpha, k - 1}</tex> — [[квантиль]] уровня <tex>1 -\alpha</tex> с <tex>k - 1</tex> степенью свободы. |
Версия 13:14, 6 января 2010
Критерий Ван дер Вардена(Van der Waerden criteria) — непараметрический статистический критерий, используемый для оценки различий между двумя выборками по признаку, измеренному в количественной шкале. Критерий является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения. Существует обобщение критерия Ван дер Вардена для выявления различий между несколькими выборками.
Содержание |
Примеры задач
Пример 1. Первая выборка — это пациенты, которых лечили препаратом А. Вторая выборка — пациенты, которых лечили препаратом Б. Значения в выборках — это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.
Пример 2. Первая выборка — это поля, обработанные агротехническим методом А. Вторая выборка — поля, обработанные агротехническим методом Б. Значения в выборках — это урожайность. Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.
Пример 3.(использование многовыборочного критерия Ван дер Вардена) Нужно проверить, как лекарство помогает в снятии соответствующего симптома. Взяты несколько групп пациентов, и каждой из них назначается определенная доза препарата. Гипотеза состоит в том, что по мере увеличения уровня дозы больные чувствуют себя лучше.
Описание критерия
Заданы две выборки .
Дополнительные предположения:
- обе выборки простые, объединённая выборка независима;
- выборки взяты из неизвестных непрерывных распределений и соответственно.
Статистика критерия:
- Построить общий вариационный ряд объединённой выборки и найти ранги элементов первой выборки в общем вариационном ряду.
- Статистика критерия Ван дер Вардена вычисляется по формуле:
, где — квантиль уровня стандартного нормального распределения
Критерий (при уровне значимости ):
- двусторонний критерий — против альтернативы
- если , то нулевая гипотеза отвергается;
- односторонний критерий -- против альтернативы
- если , то нулевая гипотеза отвергается;
Здесь -- это -квантиль табличного распределения статистики Ван дер Вардена с параметрами .
Асимптотический критерий
Распределение статистики Ван дер Вардена асимптотически нормально с нулевым матожиданием и дисперсией
Нормальную аппроксимацию статистики Ван дер Вардена можно использовать при .
В этом случае критерии (при уровне значимости ) будет выглядеть следующим образом:
- двусторонний критерий , то нулевая гипотеза отвергается;
- односторонний критерий -- против альтернативы
- если , то нулевая гипотеза отвергается;
Свойства критерия Ван дер Вардена
Если выборки подчиняются нормальному распределению, то критерий Ван дер Вардена асимптотически имеет ту же мощность, что и критерий Стьюдента.
При критерий Ван дер Вардена не уступает в эффективности критерию Стьюдента
Многовыборочное обобщение критерия Ван дер Вардена
Заданы k выборок: . Объединённая выборка: .
Дополнительные предположения:
- все выборки простые, объединённая выборка независима;
- выборки взяты из неизвестных непрерывных распределений .
Статистика критерия: Все элементов выборок упорядочиваются по возрастанию, через обозначается ранг j-го элемента i-й выборки в полученном вариационном ряду.
Статистика Ван дер Вардена имеет вид
Проверяется нулевая гипотеза против альтернативы .
Если нулевая гипотеза выполнена, то поведение статистики хорошо описывается распределением хи-квадарат с степенью свободы.
Нулевая гипотеза отвергается при уровне значимости , если , где — квантиль уровня с степенью свободы.
История
Критерий был предложен Ван дер Варденом в 1953 году.
Литература
- Ван дер Варден Б.Л. Математическая статистика/Пер.с нем. — М.: Иностранная литература,1960 — 450 c.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
См. также
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Статистика (функция выборки)
- Критерий Стьюдента
- Критерий Уилкоксона-Манна-Уитни — другой непараметрический критерий для оценки
различия между двумя выборками
- Критерий Краскела-Уоллиса — критерий для проверки равенства средних нескольких выборок
Ссылки
Van_der_Waerden_test - статья в Википедии о многовыборочном критерии Ван дер Вардена
Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |