Участник:Slimper/Песочница
Материал из MachineLearning.
(→Примеры задач) |
|||
Строка 1: | Строка 1: | ||
'''Критерий Ван дер Вардена(Van der Waerden criteria)''' — [[непараметрический статистический критерий]], используемый для оценки различий между двумя [[выборка]]ми по признаку, измеренному в количественной [[шкала измерения|шкале]]. Критерий является ранговым, поэтому он инвариантен по отношению | '''Критерий Ван дер Вардена(Van der Waerden criteria)''' — [[непараметрический статистический критерий]], используемый для оценки различий между двумя [[выборка]]ми по признаку, измеренному в количественной [[шкала измерения|шкале]]. Критерий является ранговым, поэтому он инвариантен по отношению | ||
к любому монотонному преобразованию шкалы измерения. | к любому монотонному преобразованию шкалы измерения. | ||
- | + | Существует обобщение критерия Ван дер Вардена для выявления различий между несколькими выборками. | |
== Примеры задач == | == Примеры задач == | ||
Строка 17: | Строка 17: | ||
Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами. | Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами. | ||
- | '''Пример 3.( | + | '''Пример 3.(использование многовыборочного критерия Ван дер Вардена)''' |
Нужно проверить, как лекарство помогает в снятии соответствующего симптома. Взяты несколько групп пациентов, и каждой из них назначается определенная доза препарата. Гипотеза состоит в том, что по мере увеличения уровня дозы больные чувствуют себя лучше. | Нужно проверить, как лекарство помогает в снятии соответствующего симптома. Взяты несколько групп пациентов, и каждой из них назначается определенная доза препарата. Гипотеза состоит в том, что по мере увеличения уровня дозы больные чувствуют себя лучше. | ||
Строка 32: | Строка 32: | ||
'''Статистика критерия:''' | '''Статистика критерия:''' | ||
# Построить общий [[вариационный ряд]] объединённой выборки <tex>z^{(1)} \leq \cdots \leq z^{(m+n)}</tex> и найти ранги <tex>r(x_i)</tex> элементов первой выборки в общем вариационном ряду. | # Построить общий [[вариационный ряд]] объединённой выборки <tex>z^{(1)} \leq \cdots \leq z^{(m+n)}</tex> и найти ранги <tex>r(x_i)</tex> элементов первой выборки в общем вариационном ряду. | ||
- | # Статистика критерия | + | # Статистика критерия Ван дер Вардена вычисляется по формуле: |
<tex>X = \sum_{i = 1}^n u( \frac{r(x_i)}{ m + n + 1} )</tex>, где | <tex>X = \sum_{i = 1}^n u( \frac{r(x_i)}{ m + n + 1} )</tex>, где | ||
<tex>u( \frac{r(x_i)}{ m + n + 1} )</tex> — [[квантиль]] уровня | <tex>u( \frac{r(x_i)}{ m + n + 1} )</tex> — [[квантиль]] уровня | ||
Строка 62: | Строка 62: | ||
* односторонний критерий -- против альтернативы <tex>H'_1:\; \mathbb{P} \{ x>y \} > 1/2</tex> | * односторонний критерий -- против альтернативы <tex>H'_1:\; \mathbb{P} \{ x>y \} > 1/2</tex> | ||
- | ::если <tex> \frac{X}{\mathbb{D}X} | + | ::если <tex> \frac{X}{\mathbb{D}X}> u_{1-\alpha} </tex>, то нулевая гипотеза отвергается; |
== Свойства критерия Ван дер Вардена == | == Свойства критерия Ван дер Вардена == | ||
Строка 75: | Строка 75: | ||
Объединённая выборка: <tex>z=x_1^{n_1}\cup x_2^{n_2}\cup \dots \cup x_k^{n_k}</tex>. | Объединённая выборка: <tex>z=x_1^{n_1}\cup x_2^{n_2}\cup \dots \cup x_k^{n_k}</tex>. | ||
- | ''Дополнительные предположения:'' | + | '''Дополнительные предположения:''' |
* все выборки [[Простая выборка|простые]], объединённая выборка [[Независимая выборка|независима]]; | * все выборки [[Простая выборка|простые]], объединённая выборка [[Независимая выборка|независима]]; | ||
* выборки взяты из неизвестных непрерывных распределений <tex>F_1(x),\dots,F_k(x)</tex>. | * выборки взяты из неизвестных непрерывных распределений <tex>F_1(x),\dots,F_k(x)</tex>. | ||
- | + | '''Статистика критерия:''' | |
+ | Все <tex>N=\sum_{i=1}^k n_i</tex> элементов выборок упорядочиваются по возрастанию, через <tex>R_{ij}</tex> обозначается ранг <i>j</i>-го элемента <i>i</i>-й выборки в полученном [[вариационный ряд|вариационном ряду]]. | ||
Статистика Ван дер Вардена имеет вид <br /> | Статистика Ван дер Вардена имеет вид <br /> | ||
Строка 89: | Строка 90: | ||
распределением [[распределение хи-квадрат|хи-квадарат]] с <tex>k - 1</tex> степенью свободы. | распределением [[распределение хи-квадрат|хи-квадарат]] с <tex>k - 1</tex> степенью свободы. | ||
- | Нулевая гипотеза отвергается, если <tex>T > \chi^2_{\alpha, k - 1}</tex>, где | + | Нулевая гипотеза отвергается при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>, если <tex>T > \chi^2_{1 - \alpha, k - 1}</tex>, где |
- | <tex>chi^2_{\alpha, k - 1}</tex> — [[квантиль]] уровня <tex>\alpha</tex> с <tex>k - 1</tex> степенью свободы. | + | <tex>chi^2_{1 - \alpha, k - 1}</tex> — [[квантиль]] уровня <tex>1 -\alpha</tex> с <tex>k - 1</tex> степенью свободы. |
Версия 13:14, 6 января 2010
Критерий Ван дер Вардена(Van der Waerden criteria) — непараметрический статистический критерий, используемый для оценки различий между двумя выборками по признаку, измеренному в количественной шкале. Критерий является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения. Существует обобщение критерия Ван дер Вардена для выявления различий между несколькими выборками.
Содержание |
Примеры задач
Пример 1. Первая выборка — это пациенты, которых лечили препаратом А. Вторая выборка — пациенты, которых лечили препаратом Б. Значения в выборках — это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.
Пример 2. Первая выборка — это поля, обработанные агротехническим методом А. Вторая выборка — поля, обработанные агротехническим методом Б. Значения в выборках — это урожайность. Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.
Пример 3.(использование многовыборочного критерия Ван дер Вардена) Нужно проверить, как лекарство помогает в снятии соответствующего симптома. Взяты несколько групп пациентов, и каждой из них назначается определенная доза препарата. Гипотеза состоит в том, что по мере увеличения уровня дозы больные чувствуют себя лучше.
Описание критерия
Заданы две выборки .
Дополнительные предположения:
- обе выборки простые, объединённая выборка независима;
- выборки взяты из неизвестных непрерывных распределений
и
соответственно.
Статистика критерия:
- Построить общий вариационный ряд объединённой выборки
и найти ранги
элементов первой выборки в общем вариационном ряду.
- Статистика критерия Ван дер Вардена вычисляется по формуле:
, где
— квантиль уровня
стандартного нормального распределения
Критерий (при уровне значимости ):
- двусторонний критерий — против альтернативы
- если
, то нулевая гипотеза отвергается;
- если
- односторонний критерий -- против альтернативы
- если
, то нулевая гипотеза отвергается;
- если
Здесь -- это
-квантиль табличного распределения статистики Ван дер Вардена с параметрами
.
Асимптотический критерий
Распределение статистики Ван дер Вардена асимптотически нормально
с нулевым матожиданием и дисперсией
Нормальную аппроксимацию статистики Ван дер Вардена можно использовать при
.
В этом случае критерии (при уровне значимости )
будет выглядеть следующим образом:
- двусторонний критерий
, то нулевая гипотеза отвергается;
- односторонний критерий -- против альтернативы
- если
, то нулевая гипотеза отвергается;
- если
Свойства критерия Ван дер Вардена
Если выборки подчиняются нормальному распределению, то критерий Ван дер Вардена асимптотически имеет ту же мощность, что и критерий Стьюдента.
При критерий Ван дер Вардена не уступает в эффективности критерию Стьюдента
Многовыборочное обобщение критерия Ван дер Вардена
Заданы k выборок:
.
Объединённая выборка:
.
Дополнительные предположения:
- все выборки простые, объединённая выборка независима;
- выборки взяты из неизвестных непрерывных распределений
.
Статистика критерия:
Все элементов выборок упорядочиваются по возрастанию, через
обозначается ранг j-го элемента i-й выборки в полученном вариационном ряду.
Статистика Ван дер Вардена имеет вид
Проверяется нулевая гипотеза против альтернативы
.
Если нулевая гипотеза выполнена, то поведение статистики хорошо описывается
распределением хи-квадарат с
степенью свободы.
Нулевая гипотеза отвергается при уровне значимости , если
, где
— квантиль уровня
с
степенью свободы.
История
Критерий был предложен Ван дер Варденом в 1953 году.
Литература
- Ван дер Варден Б.Л. Математическая статистика/Пер.с нем. — М.: Иностранная литература,1960 — 450 c.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
См. также
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Статистика (функция выборки)
- Критерий Стьюдента
- Критерий Уилкоксона-Манна-Уитни — другой непараметрический критерий для оценки
различия между двумя выборками
- Критерий Краскела-Уоллиса — критерий для проверки равенства средних нескольких выборок
Ссылки
Van_der_Waerden_test - статья в Википедии о многовыборочном критерии Ван дер Вардена
![]() | Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |