Критерий знаков
Материал из MachineLearning.
Критерий знаков (sign test) — статистический критерий, позволяющий проверить нулевую гипотезу, что выборка подчиняется биномиальному распределению с параметром . Критерий знаков можно использовать как непараметрический статистический критерий для проверки гипотезы равенства медианы заданному значению (в частности, нулю), а также отсутствия сдвига (отсутствия эффекта обработки) в двух связных выборках. Он также позволяет проверять гипотезу симметричности распределения, однако для этого существуют и более мощные критерии — одновыборочный критерий Уилкоксона и его модификации.
Содержание |
Гипотеза биномиальности
Пример задачи. В серии из подбрасываний монеты раз выпал орёл. Можно ли считать монету симметричной?
Задана бинарная простая выборка .
Нулевая гипотеза .
Статистика критерия:
Критерий (при уровне значимости ):
- против альтернативы
- если , то нулевая гипотеза отвергается;
- против альтернативы
- если , то нулевая гипотеза отвергается;
- против альтернативы
- если , то нулевая гипотеза отвергается;
где — левый хвост биномиального распределения с параметром .
Значение является пи-величиной (p-value) данного критерия относительно альтернативы .
Гипотеза равенства медианы заданному значению
Задана простая выборка .
Нулевая гипотеза , где — заданное значение.
Задача сводится к предыдущей, если перейти к бинарной выборке Если в выборке имеются значения , то их следует исключить из выборки, уменьшив число наблюдений.
Гипотеза отсутствия сдвига (эффекта обработки)
Пример задачи. Первая выборка — это значения некоторой характеристики состояния пациентов, записанные до лечения. Вторая выборка — это значения той же характеристики состояния тех же пациентов, записанные после лечения. Порядок элементов (в данном случае пациентов) в выборках и объёмы выборок обязаны совпадать. Такие выборки называются связными. Требуется выяснить, является ли лечение эффективным, то есть имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны.
Заданы две выборки одинаковой длины .
Дополнительные предположения:
- обе выборки простые;
- выборки связные, то есть элементы соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).
Нулевая гипотеза .
Задача сводится к предыдущей, если перейти к бинарной выборке Если в выборке имеются случаи , то их следует исключить из выборки, уменьшив число наблюдений.
Литература
- Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Статистика (функция выборки).
- Sign test (Wikipedia).