Медианный критерий
Материал из MachineLearning.
(Новая: здесь будет статья про медианный критерий) |
м (→Описание критерия) |
||
(13 промежуточных версий не показаны.) | |||
Строка 1: | Строка 1: | ||
- | + | '''Медианный критерий''' — [[непараметрический статистический критерий]], относится к классу [[ранговый критерий| ранговых критериев]] сдвига. То есть проверяет гипотезу о том, что распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу. | |
+ | |||
+ | == Описание критерия == | ||
+ | Пусть <tex>X = (X_1,\ldots,X_m)</tex> и <tex>Y = (Y_1,\ldots,Y_n)</tex> - случайные выборки с плотностями <tex>f_1</tex> и <tex>f_2</tex> соответственно. | ||
+ | |||
+ | '''[[Нулевая гипотеза]]''' <tex>H_0:\; f_1(x) = f_2(x)</tex>. | ||
+ | '''Альтернатива''' <tex>H_1:\; f_1(x) = f_2(x-\Delta), \Delta \neq 0</tex>. То есть плотности идентичны за исключением сдвига. | ||
+ | |||
+ | '''Статистика критерия:''' | ||
+ | * Строится общий [[вариационный ряд]] объединённой выборки <tex>Z_{(1)} \leq \cdots \leq Z_{(m+n)}</tex>. <tex>R _i</tex> - ранги элементов первой выборки в общем вариационном ряду. | ||
+ | * ''Форма 1'' | ||
+ | Находится медиана упорядоченной объединенной выборки <tex>Z</tex> и подсчитывается число наблюдений выборки <tex>X</tex>, превосходящих медиану (если <tex>(m+n)</tex> нечетно и медиана принадлежит выборке <tex>X</tex>, то это число увеличивается на <tex>\frac{1}{2}</tex>). Тогда статистика критерия может быть записана так: | ||
+ | ::<tex>S = \sum_{i=1}^{m}\frac{1}{2}[sign(R_i - \frac{m+n+1}{2} )+ 1]</tex> | ||
+ | |||
+ | При <tex>n,m > 10</tex> распределение статистики <tex>S</tex> удовлетворительно описывается [[нормальное распределение|нормальным]] со средним <tex>\mathbf{M}(S) = \frac{m}{2}</tex> и дисперсией | ||
+ | |||
+ | ::<tex>\mathbf{D}(S) = \frac{mn}{4(m+n-1)}</tex>, если <tex>m+n = 2k</tex> и | ||
+ | ::<tex>\mathbf{D}(S) = \frac{mn}{4(m+n)}</tex>, если <tex>m+n = 2k-1</tex> | ||
+ | |||
+ | Если | ||
+ | ::<tex>|S^*| = \frac{|S-\mathbf{M}(S)|}{ \sqrt{\mathbf{D}(S)}} < U_{1-\frac{\alpha}{2}}</tex>, | ||
+ | то с достоверностью <tex>\alpha</tex> гипотеза сдвига отклоняется. | ||
+ | * ‘’Форма 2’’ | ||
+ | Пусть <tex>A</tex> и <tex>C</tex> – количество элементов выборки <tex>X</tex>, соответственно больших и меньших медианы объединенной выборки, а <tex>B</tex> и <tex>D</tex> - аналогичные числа для выборки <tex>Y</tex>. | ||
+ | Тогда статистикой критерия сдвига является величина | ||
+ | ::<tex>\chi^2 = \frac{(n+m)(|AD-BC|-\frac{n+m}{2})^2}{(A+B)(C+D)+(A+C)(B+D)}</tex>, | ||
+ | |||
+ | Имеющая, при отсутствии сдвига, распределение хи-квадрат с 1 степенью свободы | ||
+ | |||
+ | == Замечания == | ||
+ | # Медианный критерий асимптотически оптимален, когда плотность <tex>f</tex> принадлежит симметрично-экспоненциальному типу. | ||
+ | #’Форма 2’ критерия применима только при <tex>n+m<40</tex> и <tex>A, B, C, D < 5</tex> | ||
+ | # Эффективность медианного критерия по сравнению с [[Критерий Стьюдента|критерием Стьюдента]] в случае нормального распределения равна <tex>\frac{2}{\pi} \approx 0,64</tex> | ||
+ | |||
+ | |||
+ | ==Сравнение с аналогичными критериями== | ||
+ | #Тест имеет низкую эффективность для диапазона выборок от умеренного до большого размера, и, в значительной степени, расценивается как устаревший. [[Критерий Уилкоксона-Манна-Уитни]] для двух выборок лучше работает в этом случае. Siegel & Castellan (1988, p. 124), считают, что медианному критерию нет никакой альтернативы, когда одно или более наблюдений находятся "за пределами шкалы". Существенное различие между двумя критериями состоит в том, что медианный критерий учитывает только положение каждого наблюдения относительно совокупной медианы, тогда как критерий Уилкоксона-Манна-Уитни принимает во внимание ранг каждого наблюдения. Таким образом из двух рассмотренных тестов, последний обычно более показателен. | ||
+ | |||
+ | ==Ссылки== | ||
+ | * [http://en.wikipedia.org/wiki/Median_test Median test] — материал из Википедии | ||
+ | * [http://www.statsoft.ru/home/portal/applications/Multivariatadvisor/Nonparametrics/Kraskel-Uoliss.htm Дисперсионный анализ Краскела-Уоллиса и медианный тест] — учебник по статистике, StatSoft | ||
+ | |||
+ | ==Литература== | ||
+ | |||
+ | * Siegel, S., & Castellan, N. J. Jr. (1988, 2nd ed.). Nonparametric statistics for the behavioral sciences. New York: McGraw-Hill. | ||
+ | * Friedlin, B. & Gastwirth, J. L. (2000). Should the median test be retired from general use? ''The American Statistician, 54'', 161-164. | ||
+ | * Я.Гаек, З. Шидак Теория ранговых решений. "Наука" Москва 1971г. | ||
+ | * Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. М.:ФизМатЛит 2006г. | ||
+ | [[Категория:Статистические тесты]] | ||
+ | |||
+ | {{Задание|Евгения Одинокова|Vokov|29 января 2009}} |
Текущая версия
Медианный критерий — непараметрический статистический критерий, относится к классу ранговых критериев сдвига. То есть проверяет гипотезу о том, что распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу.
Содержание |
Описание критерия
Пусть и - случайные выборки с плотностями и соответственно.
Нулевая гипотеза . Альтернатива . То есть плотности идентичны за исключением сдвига.
Статистика критерия:
- Строится общий вариационный ряд объединённой выборки . - ранги элементов первой выборки в общем вариационном ряду.
- Форма 1
Находится медиана упорядоченной объединенной выборки и подсчитывается число наблюдений выборки , превосходящих медиану (если нечетно и медиана принадлежит выборке , то это число увеличивается на ). Тогда статистика критерия может быть записана так:
При распределение статистики удовлетворительно описывается нормальным со средним и дисперсией
- , если и
- , если
Если
- ,
то с достоверностью гипотеза сдвига отклоняется.
- ‘’Форма 2’’
Пусть и – количество элементов выборки , соответственно больших и меньших медианы объединенной выборки, а и - аналогичные числа для выборки . Тогда статистикой критерия сдвига является величина
- ,
Имеющая, при отсутствии сдвига, распределение хи-квадрат с 1 степенью свободы
Замечания
- Медианный критерий асимптотически оптимален, когда плотность принадлежит симметрично-экспоненциальному типу.
- ’Форма 2’ критерия применима только при и
- Эффективность медианного критерия по сравнению с критерием Стьюдента в случае нормального распределения равна
Сравнение с аналогичными критериями
- Тест имеет низкую эффективность для диапазона выборок от умеренного до большого размера, и, в значительной степени, расценивается как устаревший. Критерий Уилкоксона-Манна-Уитни для двух выборок лучше работает в этом случае. Siegel & Castellan (1988, p. 124), считают, что медианному критерию нет никакой альтернативы, когда одно или более наблюдений находятся "за пределами шкалы". Существенное различие между двумя критериями состоит в том, что медианный критерий учитывает только положение каждого наблюдения относительно совокупной медианы, тогда как критерий Уилкоксона-Манна-Уитни принимает во внимание ранг каждого наблюдения. Таким образом из двух рассмотренных тестов, последний обычно более показателен.
Ссылки
- Median test — материал из Википедии
- Дисперсионный анализ Краскела-Уоллиса и медианный тест — учебник по статистике, StatSoft
Литература
- Siegel, S., & Castellan, N. J. Jr. (1988, 2nd ed.). Nonparametric statistics for the behavioral sciences. New York: McGraw-Hill.
- Friedlin, B. & Gastwirth, J. L. (2000). Should the median test be retired from general use? The American Statistician, 54, 161-164.
- Я.Гаек, З. Шидак Теория ранговых решений. "Наука" Москва 1971г.
- Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. М.:ФизМатЛит 2006г.
Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |