Участник:Slimper/Песочница
Материал из MachineLearning.
Строка 1: | Строка 1: | ||
- | '''Критерий Ван | + | '''Критерий Ван дер Вардена(Van der Waerden criteria)''' — [[непараметрический статистический критерий]], используемый для оценки различий между двумя [[выборка]]ми по признаку, измеренному в количественной [[шкала измерения|шкале]]. Критерий является ранговым, поэтому он инвариантен по отношению |
к любому монотонному преобразованию шкалы измерения. | к любому монотонному преобразованию шкалы измерения. | ||
+ | Для выявления различий между несколькими выборками существует многовыборочный критерий Ван дер Вардена. | ||
== Примеры задач == | == Примеры задач == | ||
Строка 36: | Строка 37: | ||
# Статистика критерия ван дер Вардена вычисляется по формуле: | # Статистика критерия ван дер Вардена вычисляется по формуле: | ||
<tex>X = \sum_{i = 1}^n u( \frac{r(x_i)}{ m + n + 1} )</tex>, где | <tex>X = \sum_{i = 1}^n u( \frac{r(x_i)}{ m + n + 1} )</tex>, где | ||
- | <tex>u( \frac{r(x_i)}{ m + n + 1} )</tex> — [[квантиль]] | + | <tex>u( \frac{r(x_i)}{ m + n + 1} )</tex> — [[квантиль]] уровня |
- | [[ | + | <tex>\frac{r(x_i)}{ m + n + 1}</tex> |
+ | [[нормальное распределение| стандартного нормального распределения]] | ||
'''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>): | '''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>): | ||
Строка 52: | Строка 54: | ||
Распределение статистики Ван дер Вардена асимптотически нормально | Распределение статистики Ван дер Вардена асимптотически нормально | ||
с нулевым матожиданием <tex>\mathbb{E}X = 0</tex> и дисперсией | с нулевым матожиданием <tex>\mathbb{E}X = 0</tex> и дисперсией | ||
- | + | ::<tex> \mathbb{D}X = \frac{mn}{(m + n)(m + n - 1)} \sum_{i = 1}^{m + n} u^2( \frac{i}{m + n + 1} ) </tex> | |
- | ::<tex> | + | |
- | \mathbb{D}X = | + | |
- | \frac{mn}{(m + n)(m + n - 1)} | + | |
- | \sum_{i = 1}^{m + n} u^2( \frac{i}{m + n + 1} ) | + | |
- | </tex> | + | |
Нормальную аппроксимацию статистики Ван дер Вардена можно использовать при | Нормальную аппроксимацию статистики Ван дер Вардена можно использовать при | ||
Строка 70: | Строка 67: | ||
::если <tex> \frac{X}{\mathbb{D}X}_> u_{1-\alpha} </tex>, то нулевая гипотеза отвергается; | ::если <tex> \frac{X}{\mathbb{D}X}_> u_{1-\alpha} </tex>, то нулевая гипотеза отвергается; | ||
- | + | == Свойства критерия Ван дер Вардена == | |
- | + | Если выборки подчиняются нормальному распределению, то критерий Ван дер Вардена асимптотически | |
- | + | имеет ту же мощность, что и [[критерий Стьюдента]]. | |
- | <tex> | + | |
- | + | При <tex>n + m \to \infty</tex> критерий Ван дер Вардена не уступает в эффективности [[Критерий Стьюдента | критерию Стьюдента]] | |
- | <tex> | + | |
- | + | == Многовыборочное обобщение критерия Ван дер Вардена == | |
- | + | Заданы <i>k</i> выборок: | |
- | + | <tex>x_1^{n_1}=\left\{x_{11},\dots,x_{1n_1}\right\}, \dots, x_k^{n_k}=\left\{x_{k1},\dots,x_{kn_k}\right\}</tex>. | |
+ | Объединённая выборка: <tex>z=x_1^{n_1}\cup x_2^{n_2}\cup \dots \cup x_k^{n_k}</tex>. | ||
+ | |||
+ | ''Дополнительные предположения:'' | ||
+ | * все выборки [[Простая выборка|простые]], объединённая выборка [[Независимая выборка|независима]]; | ||
+ | * выборки взяты из неизвестных непрерывных распределений <tex>F_1(x),\dots,F_k(x)</tex>. | ||
+ | |||
+ | Упорядочим все <tex>N=\sum_{i=1}^k n_i</tex> элементов выборок по возрастанию и обозначим <tex>R_{ij}</tex> ранг <i>j</i>-го элемента <i>i</i>-й выборки в полученном [[вариационный ряд|вариационном ряду]]. | ||
+ | |||
+ | Статистика Ван дер Вардена имеет вид <br /> | ||
+ | :: <tex>T = \left(\sum_{i = 1}^N u^2( \frac{i}{N + 1} ) \right)^{-1} (N - 1) \sum_{i = 1}^{k} \frac{1}{n_i} \left( \sum_{j=1}^{n_i} u^2( \frac{R_{ij}}{N + 1} ) \right)^2</tex> <br/> | ||
- | + | Проверяется [[нулевая гипотеза]] <tex>H_0:\; F_1(x)=\dots=F_k(x)</tex> против альтернативы <tex>H_1:\; F_1(x)=F_2(x-\Delta_1)=\dots=F_k(x-\Delta_{k-1})</tex>. | |
- | + | ||
- | + | Если нулевая гипотеза выполнена, то поведение статистики <tex>T</tex> хорошо описывается | |
- | + | распределением [[распределение хи-квадрат|хи-квадарат]] с <tex>k - 1</tex> степенью свободы. | |
- | + | ||
- | + | ||
- | + | Нулевая гипотеза отвергается, если <tex>T > \chi^2_{\alpha, k - 1}</tex>, где | |
- | + | <tex>chi^2_{\alpha, k - 1}</tex> — [[квантиль]] уровня <tex>\alpha</tex> с <tex>k - 1</tex> степенью свободы. | |
- | |||
== История == | == История == | ||
- | Критерий был предложен Ван | + | Критерий был предложен Ван дер Варденом в 1953 году. |
== Литература == | == Литература == | ||
- | # '' | + | # ''Ван дер Варден Б.Л.'' Математическая статистика/Пер.с нем. — М.: Иностранная литература,1960 — 450 c. |
# ''Кобзарь А. И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с. | # ''Кобзарь А. И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с. | ||
Строка 104: | Строка 107: | ||
* [[Статистика (функция выборки)]] | * [[Статистика (функция выборки)]] | ||
* [[Критерий Стьюдента]] | * [[Критерий Стьюдента]] | ||
+ | * [[Критерий Уилкоксона-Манна-Уитни]] — другой непараметрический критерий для оценки | ||
+ | различия между двумя выборками | ||
+ | * [[Критерий Краскела-Уоллиса]] — критерий для проверки равенства средних нескольких выборок | ||
== Ссылки == | == Ссылки == | ||
+ | [http://en.wikipedia.org/wiki/Van_der_Waerden_test| Van_der_Waerden_test ] - статья в Википедии | ||
+ | о многовыборочном критерии Ван дер Вардена | ||
[[Категория:Статистические тесты]] | [[Категория:Статистические тесты]] | ||
[[Категория:Непараметрические статистические тесты]] | [[Категория:Непараметрические статистические тесты]] | ||
{{Задание|Slimper|Vokov|08 января 2010}} | {{Задание|Slimper|Vokov|08 января 2010}} |
Версия 13:02, 6 января 2010
Критерий Ван дер Вардена(Van der Waerden criteria) — непараметрический статистический критерий, используемый для оценки различий между двумя выборками по признаку, измеренному в количественной шкале. Критерий является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения. Для выявления различий между несколькими выборками существует многовыборочный критерий Ван дер Вардена.
Содержание |
Примеры задач
Пример 1. Первая выборка — это пациенты, которых лечили препаратом А. Вторая выборка — пациенты, которых лечили препаратом Б. Значения в выборках — это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.
Пример 2. Первая выборка — это поля, обработанные агротехническим методом А. Вторая выборка — поля, обработанные агротехническим методом Б. Значения в выборках — это урожайность. Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.
Пример 3. Первая выборка — это дни, когда в супермаркете проходила промо-акция типа А (красные ценники со скидкой). Вторая выборка — дни промо-акции типа Б (каждая пятая пачка бесплатно). Значения в выборках — это показатель эффективности промо-акции (объём продаж, либо выручка в рублях). Требуется выяснить, какой из типов промо-акции более эффективен.
Описание критерия
Заданы две выборки .
Дополнительные предположения:
- обе выборки простые, объединённая выборка независима;
- выборки взяты из неизвестных непрерывных распределений и соответственно.
Статистика критерия:
- Построить общий вариационный ряд объединённой выборки и найти ранги элементов первой выборки в общем вариационном ряду.
- Статистика критерия ван дер Вардена вычисляется по формуле:
, где — квантиль уровня стандартного нормального распределения
Критерий (при уровне значимости ):
- двусторонний критерий — против альтернативы
- если , то нулевая гипотеза отвергается;
- односторонний критерий -- против альтернативы
- если , то нулевая гипотеза отвергается;
Здесь -- это -квантиль табличного распределения статистики Ван дер Вардена с параметрами .
Асимптотический критерий
Распределение статистики Ван дер Вардена асимптотически нормально с нулевым матожиданием и дисперсией
Нормальную аппроксимацию статистики Ван дер Вардена можно использовать при .
В этом случае критерии (при уровне значимости ) будет выглядеть следующим образом:
- двусторонний критерий , то нулевая гипотеза отвергается;
- односторонний критерий -- против альтернативы
- если , то нулевая гипотеза отвергается;
Свойства критерия Ван дер Вардена
Если выборки подчиняются нормальному распределению, то критерий Ван дер Вардена асимптотически имеет ту же мощность, что и критерий Стьюдента.
При критерий Ван дер Вардена не уступает в эффективности критерию Стьюдента
Многовыборочное обобщение критерия Ван дер Вардена
Заданы k выборок: . Объединённая выборка: .
Дополнительные предположения:
- все выборки простые, объединённая выборка независима;
- выборки взяты из неизвестных непрерывных распределений .
Упорядочим все элементов выборок по возрастанию и обозначим ранг j-го элемента i-й выборки в полученном вариационном ряду.
Статистика Ван дер Вардена имеет вид
Проверяется нулевая гипотеза против альтернативы .
Если нулевая гипотеза выполнена, то поведение статистики хорошо описывается распределением хи-квадарат с степенью свободы.
Нулевая гипотеза отвергается, если , где — квантиль уровня с степенью свободы.
История
Критерий был предложен Ван дер Варденом в 1953 году.
Литература
- Ван дер Варден Б.Л. Математическая статистика/Пер.с нем. — М.: Иностранная литература,1960 — 450 c.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
См. также
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Статистика (функция выборки)
- Критерий Стьюдента
- Критерий Уилкоксона-Манна-Уитни — другой непараметрический критерий для оценки
различия между двумя выборками
- Критерий Краскела-Уоллиса — критерий для проверки равенства средних нескольких выборок
Ссылки
Van_der_Waerden_test - статья в Википедии о многовыборочном критерии Ван дер Вардена
Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |