Критерий знаков
Материал из MachineLearning.
(Новая: '''Критерий знаков''' (sign test) — статистический критерий, позволяющий проверить [[Нулевая гипотеза|нул...) |
(→Гипотеза отсутствия сдвига (эффекта обработки): уточнение) |
||
(2 промежуточные версии не показаны) | |||
Строка 24: | Строка 24: | ||
::если <tex> \mathrm{Bin}_p(m,k) > 1-\alpha </tex>, то нулевая гипотеза отвергается; | ::если <tex> \mathrm{Bin}_p(m,k) > 1-\alpha </tex>, то нулевая гипотеза отвергается; | ||
- | где <tex> \mathrm{Bin}_p(m,k) = 2^{-m}\sum_{i= | + | где <tex> \mathrm{Bin}_p(m,k) = 2^{-m}\sum_{i=0}^k C_m^i </tex> — левый хвост [[Биномиальное распределение|биномиального распределения]] с параметром <tex>p=1/2</tex>. |
Значение <tex> \mathrm{Bin}_p(m,k) </tex> является [[Пи-величина|пи-величиной]] (p-value) данного критерия относительно альтернативы <tex>H'_1</tex>. | Значение <tex> \mathrm{Bin}_p(m,k) </tex> является [[Пи-величина|пи-величиной]] (p-value) данного критерия относительно альтернативы <tex>H'_1</tex>. | ||
Строка 41: | Строка 41: | ||
== Гипотеза отсутствия сдвига (эффекта обработки) == | == Гипотеза отсутствия сдвига (эффекта обработки) == | ||
+ | '''Пример задачи.''' | ||
+ | Первая выборка — это значения некоторой характеристики состояния пациентов, записанные ''до'' лечения. | ||
+ | Вторая выборка — это значения ''той же'' характеристики состояния ''тех же'' пациентов, записанные ''после'' лечения. | ||
+ | Порядок элементов (в данном случае пациентов) в выборках и объёмы выборок обязаны совпадать. | ||
+ | Такие выборки называются ''связными''. | ||
+ | Требуется выяснить, является ли лечение эффективным, | ||
+ | то есть имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны. | ||
+ | |||
Заданы две выборки одинаковой длины <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^m = (y_1,\ldots,y_m),\; y_i \in \mathbb{R}</tex>. | Заданы две выборки одинаковой длины <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^m = (y_1,\ldots,y_m),\; y_i \in \mathbb{R}</tex>. | ||
Строка 54: | Строка 62: | ||
<tex> x_i = y_i </tex>, | <tex> x_i = y_i </tex>, | ||
то их следует исключить из выборки, уменьшив число наблюдений. | то их следует исключить из выборки, уменьшив число наблюдений. | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
== Литература == | == Литература == |
Текущая версия
Критерий знаков (sign test) — статистический критерий, позволяющий проверить нулевую гипотезу, что выборка подчиняется биномиальному распределению с параметром . Критерий знаков можно использовать как непараметрический статистический критерий для проверки гипотезы равенства медианы заданному значению (в частности, нулю), а также отсутствия сдвига (отсутствия эффекта обработки) в двух связных выборках. Он также позволяет проверять гипотезу симметричности распределения, однако для этого существуют и более мощные критерии — одновыборочный критерий Уилкоксона и его модификации.
Содержание |
Гипотеза биномиальности
Пример задачи. В серии из подбрасываний монеты раз выпал орёл. Можно ли считать монету симметричной?
Задана бинарная простая выборка .
Нулевая гипотеза .
Статистика критерия:
Критерий (при уровне значимости ):
- против альтернативы
- если , то нулевая гипотеза отвергается;
- против альтернативы
- если , то нулевая гипотеза отвергается;
- против альтернативы
- если , то нулевая гипотеза отвергается;
где — левый хвост биномиального распределения с параметром .
Значение является пи-величиной (p-value) данного критерия относительно альтернативы .
Гипотеза равенства медианы заданному значению
Задана простая выборка .
Нулевая гипотеза , где — заданное значение.
Задача сводится к предыдущей, если перейти к бинарной выборке Если в выборке имеются значения , то их следует исключить из выборки, уменьшив число наблюдений.
Гипотеза отсутствия сдвига (эффекта обработки)
Пример задачи. Первая выборка — это значения некоторой характеристики состояния пациентов, записанные до лечения. Вторая выборка — это значения той же характеристики состояния тех же пациентов, записанные после лечения. Порядок элементов (в данном случае пациентов) в выборках и объёмы выборок обязаны совпадать. Такие выборки называются связными. Требуется выяснить, является ли лечение эффективным, то есть имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны.
Заданы две выборки одинаковой длины .
Дополнительные предположения:
- обе выборки простые;
- выборки связные, то есть элементы соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).
Нулевая гипотеза .
Задача сводится к предыдущей, если перейти к бинарной выборке Если в выборке имеются случаи , то их следует исключить из выборки, уменьшив число наблюдений.
Литература
- Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Статистика (функция выборки).
- Sign test (Wikipedia).