Участник:Slimper/Песочница

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(См. также)
(Примеры задач)
Строка 3: Строка 3:
== Примеры задач ==
== Примеры задач ==
-
 
'''Пример 1.'''
'''Пример 1.'''
-
Первая выборка — это пациенты, которых лечили препаратом А.
+
Ряд значений состоит из подсчитанного на протяжении нескольких лет количества туристов, въезжавших в страну в течение года.
-
Вторая выборка — пациенты, которых лечили препаратом Б.
+
Требуется установить, является ли изменение числа туристов случайным, или оно
-
Значения в выборках — это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.)
+
подчиняется какой-то закономерности.
-
Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.
+
-
 
+
-
'''Пример 2.'''
+
-
Первая выборка — это поля, обработанные агротехническим методом А.
+
-
Вторая выборка — поля, обработанные агротехническим методом Б.
+
-
Значения в выборках — это урожайность.
+
-
Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.
+
-
 
+
-
'''Пример 3.(использование многовыборочного критерия Ван дер Вардена)'''
+
-
Нужно проверить, как лекарство помогает в снятии соответствующего симптома. Взяты несколько групп пациентов, и каждой из них назначается определенная доза препарата. Гипотеза состоит в том, что по мере увеличения уровня дозы больные чувствуют себя лучше.
+
== Описание критерия ==
== Описание критерия ==

Версия 16:55, 7 января 2010

Критерий Бартелса (Bartels test)непараметрический статистический критерий, используемый для проверки случайности ряда наблюдаемых значений. Критерий является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения. Основной областью применений критерия Бартелса является анализ временных рядов.

Содержание

Примеры задач

Пример 1. Ряд значений состоит из подсчитанного на протяжении нескольких лет количества туристов, въезжавших в страну в течение года. Требуется установить, является ли изменение числа туристов случайным, или оно подчиняется какой-то закономерности.

Описание критерия

Заданы две выборки x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}.

Дополнительные предположения:

  • обе выборки простые, объединённая выборка независима;
  • выборки взяты из неизвестных непрерывных распределений F(x) и G(y) соответственно.

Нулевая гипотеза H_0:\; F(x) = G(y).

Статистика критерия:

  1. Построить общий вариационный ряд объединённой выборки z^{(1)} \leq \cdots \leq z^{(m+n)} и найти ранги r(x_i) элементов первой выборки в общем вариационном ряду.
  2. Статистика критерия Ван дер Вардена вычисляется по формуле:

X = \sum_{i = 1}^n u( \frac{r(x_i)}{ m + n + 1} ), где u( \frac{r(x_i)}{ m + n + 1} )квантиль уровня \frac{r(x_i)}{ m + n + 1} стандартного нормального распределения

Критерий (при уровне значимости \alpha):

  • двусторонний критерий — против альтернативы H_1:\; \mathbb{P} \{ x<y \} \neq 1/2
если  X \notin \left[ X_{\alpha/2},\, X_{1-\alpha/2} \right] , то нулевая гипотеза отвергается;
  • односторонний критерий -- против альтернативы H'_1:\; \mathbb{P} \{ x>y \} > 1/2
если  X_> X_{1-\alpha} , то нулевая гипотеза отвергается;

Здесь  X_{\alpha} -- это \alpha-квантиль табличного распределения статистики Ван дер Вардена с параметрами m,\,n.

Асимптотический критерий

Распределение статистики Ван дер Вардена асимптотически нормально с нулевым матожиданием \mathbb{E}X = 0 и дисперсией

 \mathbb{D}X = \frac{mn}{(m + n)(m + n - 1)} \sum_{i = 1}^{m + n} u^2( \frac{i}{m + n + 1} )

Нормальную аппроксимацию статистики Ван дер Вардена можно использовать при  m, n \geqslant 20.

В этом случае критерии (при уровне значимости \alpha) будет выглядеть следующим образом:

  • двусторонний критерий  \frac{X}{\mathbb{D}X} \notin \left[ u_{\alpha/2},\, u_{1-\alpha/2} \right] , то нулевая гипотеза отвергается;
  • односторонний критерий -- против альтернативы H'_1:\; \mathbb{P} \{ x>y \} > 1/2
если  \frac{X}{\mathbb{D}X}> u_{1-\alpha} , то нулевая гипотеза отвергается;

Свойства критерия Ван дер Вардена

Если выборки подчиняются нормальному распределению, то критерий Ван дер Вардена асимптотически имеет ту же мощность, что и критерий Стьюдента.

При n + m \to \infty критерий Ван дер Вардена не уступает в эффективности критерию Стьюдента

Многовыборочное обобщение критерия Ван дер Вардена

Заданы k выборок: x_1^{n_1}=\left\{x_{11},\dots,x_{1n_1}\right\}, \dots, x_k^{n_k}=\left\{x_{k1},\dots,x_{kn_k}\right\}. Объединённая выборка: z=x_1^{n_1}\cup x_2^{n_2}\cup \dots \cup x_k^{n_k}.

Дополнительные предположения:

  • все выборки простые, объединённая выборка независима;
  • выборки взяты из неизвестных непрерывных распределений F_1(x),\dots,F_k(x).

Статистика критерия: Все N=\sum_{i=1}^k n_i элементов выборок упорядочиваются по возрастанию, через R_{ij} обозначается ранг j-го элемента i-й выборки в полученном вариационном ряду.

Статистика Ван дер Вардена имеет вид

T = \left(\sum_{i = 1}^N u^2( \frac{i}{N + 1} ) \right)^{-1} (N - 1) \sum_{i = 1}^{k} \frac{1}{n_i} \left( \sum_{j=1}^{n_i}  u^2( \frac{R_{ij}}{N + 1} ) \right)^2

Проверяется нулевая гипотеза H_0:\; F_1(x)=\dots=F_k(x) против альтернативы H_1:\; F_1(x)=F_2(x-\Delta_1)=\dots=F_k(x-\Delta_{k-1}).

Если нулевая гипотеза выполнена, то поведение статистики T хорошо описывается распределением хи-квадарат с k - 1 степенью свободы.

Нулевая гипотеза отвергается при уровне значимости \alpha, если T > \chi^2_{1 - \alpha, k - 1}, где chi^2_{1 - \alpha, k - 1}квантиль уровня 1 -\alpha с k - 1 степенью свободы.


История

Критерий был предложен Бартелсом в 1982 году.

Литература

  1. Gibbons J. D., Chakraborti S. Nonparametric Statistical Inference, 4th Ed. — CRC, 2003 — 608 с.
  2. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.

См. также

Ссылки

[

Данная статья является непроверенным учебным заданием.
Студент: Участник:Slimper
Преподаватель: Участник:Vokov
Срок: 08 января 2010

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.


Личные инструменты