Медианный критерий

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Текущая версия (16:57, 14 октября 2012) (править) (отменить)
м (Описание критерия)
 
Строка 11: Строка 11:
* ''Форма 1''
* ''Форма 1''
Находится медиана упорядоченной объединенной выборки <tex>Z</tex> и подсчитывается число наблюдений выборки <tex>X</tex>, превосходящих медиану (если <tex>(m+n)</tex> нечетно и медиана принадлежит выборке <tex>X</tex>, то это число увеличивается на <tex>\frac{1}{2}</tex>). Тогда статистика критерия может быть записана так:
Находится медиана упорядоченной объединенной выборки <tex>Z</tex> и подсчитывается число наблюдений выборки <tex>X</tex>, превосходящих медиану (если <tex>(m+n)</tex> нечетно и медиана принадлежит выборке <tex>X</tex>, то это число увеличивается на <tex>\frac{1}{2}</tex>). Тогда статистика критерия может быть записана так:
-
::<tex>S = \sum_{i=1}^{m}\frac{1}{2}[sign(R_i - \frac{m+n+1}{2} + 1)]</tex>
+
::<tex>S = \sum_{i=1}^{m}\frac{1}{2}[sign(R_i - \frac{m+n+1}{2} )+ 1]</tex>
При <tex>n,m > 10</tex> распределение статистики <tex>S</tex> удовлетворительно описывается [[нормальное распределение|нормальным]] со средним <tex>\mathbf{M}(S) = \frac{m}{2}</tex> и дисперсией
При <tex>n,m > 10</tex> распределение статистики <tex>S</tex> удовлетворительно описывается [[нормальное распределение|нормальным]] со средним <tex>\mathbf{M}(S) = \frac{m}{2}</tex> и дисперсией
Строка 27: Строка 27:
Имеющая, при отсутствии сдвига, распределение хи-квадрат с 1 степенью свободы
Имеющая, при отсутствии сдвига, распределение хи-квадрат с 1 степенью свободы
 +
== Замечания ==
== Замечания ==
# Медианный критерий асимптотически оптимален, когда плотность <tex>f</tex> принадлежит симметрично-экспоненциальному типу.
# Медианный критерий асимптотически оптимален, когда плотность <tex>f</tex> принадлежит симметрично-экспоненциальному типу.

Текущая версия

Медианный критерийнепараметрический статистический критерий, относится к классу ранговых критериев сдвига. То есть проверяет гипотезу о том, что распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу.

Содержание

Описание критерия

Пусть X = (X_1,\ldots,X_m) и Y = (Y_1,\ldots,Y_n) - случайные выборки с плотностями f_1 и f_2 соответственно.

Нулевая гипотеза H_0:\; f_1(x) = f_2(x). Альтернатива H_1:\; f_1(x) = f_2(x-\Delta), \Delta \neq 0. То есть плотности идентичны за исключением сдвига.

Статистика критерия:

  • Строится общий вариационный ряд объединённой выборки Z_{(1)} \leq \cdots \leq Z_{(m+n)}. R _i - ранги элементов первой выборки в общем вариационном ряду.
  • Форма 1

Находится медиана упорядоченной объединенной выборки Z и подсчитывается число наблюдений выборки X, превосходящих медиану (если (m+n) нечетно и медиана принадлежит выборке X, то это число увеличивается на \frac{1}{2}). Тогда статистика критерия может быть записана так:

S = \sum_{i=1}^{m}\frac{1}{2}[sign(R_i - \frac{m+n+1}{2} )+ 1]

При n,m > 10 распределение статистики S удовлетворительно описывается нормальным со средним \mathbf{M}(S) = \frac{m}{2} и дисперсией

\mathbf{D}(S) = \frac{mn}{4(m+n-1)}, если m+n = 2k и
\mathbf{D}(S) = \frac{mn}{4(m+n)}, если m+n = 2k-1

Если

|S^*| = \frac{|S-\mathbf{M}(S)|}{ \sqrt{\mathbf{D}(S)}} < U_{1-\frac{\alpha}{2}},

то с достоверностью \alpha гипотеза сдвига отклоняется.

  • ‘’Форма 2’’

Пусть A и C – количество элементов выборки X, соответственно больших и меньших медианы объединенной выборки, а B и D - аналогичные числа для выборки Y. Тогда статистикой критерия сдвига является величина

\chi^2 = \frac{(n+m)(|AD-BC|-\frac{n+m}{2})^2}{(A+B)(C+D)+(A+C)(B+D)},

Имеющая, при отсутствии сдвига, распределение хи-квадрат с 1 степенью свободы

Замечания

  1. Медианный критерий асимптотически оптимален, когда плотность f принадлежит симметрично-экспоненциальному типу.
  2. ’Форма 2’ критерия применима только при n+m<40 и A, B, C, D < 5
  3. Эффективность медианного критерия по сравнению с критерием Стьюдента в случае нормального распределения равна \frac{2}{\pi} \approx 0,64


Сравнение с аналогичными критериями

  1. Тест имеет низкую эффективность для диапазона выборок от умеренного до большого размера, и, в значительной степени, расценивается как устаревший. Критерий Уилкоксона-Манна-Уитни для двух выборок лучше работает в этом случае. Siegel & Castellan (1988, p. 124), считают, что медианному критерию нет никакой альтернативы, когда одно или более наблюдений находятся "за пределами шкалы". Существенное различие между двумя критериями состоит в том, что медианный критерий учитывает только положение каждого наблюдения относительно совокупной медианы, тогда как критерий Уилкоксона-Манна-Уитни принимает во внимание ранг каждого наблюдения. Таким образом из двух рассмотренных тестов, последний обычно более показателен.

Ссылки

Литература

  • Siegel, S., & Castellan, N. J. Jr. (1988, 2nd ed.). Nonparametric statistics for the behavioral sciences. New York: McGraw-Hill.
  • Friedlin, B. & Gastwirth, J. L. (2000). Should the median test be retired from general use? The American Statistician, 54, 161-164.
  • Я.Гаек, З. Шидак Теория ранговых решений. "Наука" Москва 1971г.
  • Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. М.:ФизМатЛит 2006г.


Данная статья является непроверенным учебным заданием.
Студент: Участник:Евгения Одинокова
Преподаватель: Участник:Vokov
Срок: 29 января 2009

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.


Личные инструменты