Участник:Василий Ломакин/Критерий Уилкоксона для связных выборок

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 1: Строка 1:
 +
TODO:
 +
# Пример
 +
# Критерий для коротких выборок
 +
# Свойства и границы применимости критерия
 +
# Всё ли я извлёк из обоих книг?
 +
# Ссылки на англоязычную литературу
 +
# Дополнительные предположения
 +
# Ссылка на что такое связки
 +
'''Критерий Уилкоксона для связных выборок''' — [[непараметрический статистический критерий]], применяющийся для связанных пар наблюдений. Наиболее часто используется для проверки гипотезы о равенстве средних в двух зависимых выборках. Является аналогом соответствующего [[Критерий_Стьюдента|t-критерия Стьюдента для парных наблюдений]] в случае закона распределения, отличного от нормального, либо для данных в нечисловой шкале.
'''Критерий Уилкоксона для связных выборок''' — [[непараметрический статистический критерий]], применяющийся для связанных пар наблюдений. Наиболее часто используется для проверки гипотезы о равенстве средних в двух зависимых выборках. Является аналогом соответствующего [[Критерий_Стьюдента|t-критерия Стьюдента для парных наблюдений]] в случае закона распределения, отличного от нормального, либо для данных в нечисловой шкале.
Строка 28: Строка 37:
Рассмотрим нормированную и центрированную статистика Уилкоксона:
Рассмотрим нормированную и центрированную статистика Уилкоксона:
-
<tex>T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}</tex>;
+
 
-
<tex>T</tex> асимптотически имеет стандартное нормальное распределение при <tex>N \ge 20</tex>
+
:<tex>T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}</tex>;
 +
 
 +
<tex>T</tex> асимптотически имеет стандартное нормальное распределение при <tex>N \ge 20</tex>.
При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:
При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:
-
<tex>\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},</tex>
+
:<tex>\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},</tex>
-
где <tex>g</tex> - количество связок, <tex>t_1, \ldots, t_g</tex> - их размеры.
+
 
 +
:где <tex>g</tex> - количество связок, <tex>t_1, \ldots, t_g</tex> - их размеры.
'''Другие гипотезы''':
'''Другие гипотезы''':
Строка 43: Строка 55:
В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме.
В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме.
-
 
== Свойства и границы применимости критерия ==
== Свойства и границы применимости критерия ==
 +
м?
== Литература ==
== Литература ==
Строка 53: Строка 65:
== Ссылки ==
== Ссылки ==
* [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез.
* [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез.
-
* [[Статистика (функция выборки)]]
+
* [[Критерий Уилкоксона-Манна-Уитни]]

Версия 18:43, 11 декабря 2009

TODO:

  1. Пример
  2. Критерий для коротких выборок
  3. Свойства и границы применимости критерия
  4. Всё ли я извлёк из обоих книг?
  5. Ссылки на англоязычную литературу
  6. Дополнительные предположения
  7. Ссылка на что такое связки

Критерий Уилкоксона для связных выборокнепараметрический статистический критерий, применяющийся для связанных пар наблюдений. Наиболее часто используется для проверки гипотезы о равенстве средних в двух зависимых выборках. Является аналогом соответствующего t-критерия Стьюдента для парных наблюдений в случае закона распределения, отличного от нормального, либо для данных в нечисловой шкале.

Содержание

Пример задачи

Описание критерия

Заданы две выборки x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}.

Дополнительные предположения:

  • простые выборки ????
  • выборки связные, то есть элементы x_i,\: y_i соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).

Нулевая гипотеза H_0:\; \mathbb{P} \{x_i-y_i < 0 \} = 1/2.

Статистика критерия:

  1. Рассчитать значения разностей пар двух выборок. Нулевые разности далее не учитываются. N - количество ненулевых разностей.
  2. Проранжировать модули разностей пар в возрастающем порядке.
  3. Приписать рангам знаки соответствующих им разностей.
  4. Рассчитать сумму R положительных рангов.

Критерий (при уровне значимости \alpha):

Против альтернативы H_1:\; \mathbb{P} \{ x_i-y_i \} \neq 1/2:

если R больше табличного значения критерия знаковых рангов Уилкоксона T^{+} с уровнем значимости \alpha/2 и числом степеней свободы N, то нулевая гипотеза отвергается.

Асимптотический критерий:

Рассмотрим нормированную и центрированную статистика Уилкоксона:

T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}};

T асимптотически имеет стандартное нормальное распределение при N \ge 20.

При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:

\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},
где g - количество связок, t_1, \ldots, t_g - их размеры.

Другие гипотезы:

H_0:\; средняя разница между значениями пар двух выборок равна заданной константе A.

H_1:\; средняя разница не равна A.

В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме.

Свойства и границы применимости критерия

м?

Литература

  1. Лапач С. Н., Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с.
  2. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 457-458 с.

Ссылки

Личные инструменты