Проверка статистических гипотез

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 19: Строка 19:
#* если <tex>T(X^m)\in\Omega</tex>, то делается вывод «данные противоречат нулевой гипотезе при уровне значимости&nbsp;<tex>\alpha</tex>».
#* если <tex>T(X^m)\in\Omega</tex>, то делается вывод «данные противоречат нулевой гипотезе при уровне значимости&nbsp;<tex>\alpha</tex>».
#* если <tex>T(X^m)\notin\Omega</tex>, то делается вывод «данные не противоречат нулевой гипотезе при уровне значимости&nbsp;<tex>\alpha</tex>».
#* если <tex>T(X^m)\notin\Omega</tex>, то делается вывод «данные не противоречат нулевой гипотезе при уровне значимости&nbsp;<tex>\alpha</tex>».
 +
 +
Итак, ''статистический критерий'' определяется статистикой&nbsp;<tex>T</tex>
 +
и критическим множеством&nbsp;<tex>\Omega</tex>, которое зависит от уровня значимости.
'''Замечание.'''
'''Замечание.'''
Если данные не противоречат нулевой гипотезе, это ещё не значит, что гипотеза верна.
Если данные не противоречат нулевой гипотезе, это ещё не значит, что гипотеза верна.
Тому есть две причины.
Тому есть две причины.
-
* По&nbsp;мере увеличения длины выборки нулевая гипотеза может сначала приниматься, но потом выявятся более тонкие несоответствия данных гипотезе, и она будет отвергнута.
+
* По&nbsp;мере увеличения длины выборки нулевая гипотеза может сначала приниматься, но потом выявятся более тонкие несоответствия данных гипотезе, и она будет отвергнута. То есть многое зависит от объёма данных; если данных не хватает, можно принять даже самую неправдоподобную гипотезу.
* Выбранная статистика <tex>T</tex> может отражать не всю информацию, содержащуюся в гипотезе&nbsp;<tex>H_0</tex>. В&nbsp;таком случае увеличивается вероятность ошибки второго рода — нулевая гипотеза может быть принята, хотя на самом деле она не верна. Допустим, например, что <tex>H_0</tex> = «распределение нормально»; <tex>T(X^m)</tex> = [[коэффициент асимметрии]]; тогда выборка с любым симметричным распределением будет признана нормальной. Чтобы избегать таких ошибок, следует пользоваться более [[Мощность критерия|мощными критериями]].
* Выбранная статистика <tex>T</tex> может отражать не всю информацию, содержащуюся в гипотезе&nbsp;<tex>H_0</tex>. В&nbsp;таком случае увеличивается вероятность ошибки второго рода — нулевая гипотеза может быть принята, хотя на самом деле она не верна. Допустим, например, что <tex>H_0</tex> = «распределение нормально»; <tex>T(X^m)</tex> = [[коэффициент асимметрии]]; тогда выборка с любым симметричным распределением будет признана нормальной. Чтобы избегать таких ошибок, следует пользоваться более [[Мощность критерия|мощными критериями]].
 +
 +
== Типы статистических гипотез ==
 +
 +
* '''Простая гипотеза''' однозначно определяет функцию распределения на множестве&nbsp;<tex>X</tex>.
 +
 +
* '''Сложная гипотеза''' утверждает принадлежность распределения к некоторому множеству распределений на&nbsp;<tex>X</tex>.
 +
 +
== Типы критической области ==
 +
Обозначим через <tex>t_z</tex> значение, которое находится из условия <tex>F(t_z) = \mathbb{P}\left\{ T<t_z \right\} = z</tex>, где&nbsp;<tex>F</tex> — функция распределения статистики&nbsp;<tex>T</tex>.
 +
Фактически, <tex>t_z</tex> есть обратная функция: <tex>t_z = F^{-1}(z)</tex>.
 +
 +
На практике, как правило, используются статистики&nbsp;<tex>T</tex> с унимодальной плотностью распределения, то есть плотностью, имеющей форму пика.
 +
Критические области (наименее вероятные значения статистики) соответствуют хвостам распределения.
 +
Поэтому чаще всего возникают критические области одного из трёх типов:
 +
 +
* '''Двусторонняя критическая область''' определяется двумя интервалами <tex>\Omega = (-\infty,\;t_{\alpha/2})\cup(t_{1-\alpha/2}\;+\infty)</tex>.
 +
 +
* '''Левосторонняя критическая область''' определяется интервалом <tex>\Omega = (-\infty,\; t_\alpha)</tex>.
 +
 +
* '''Правосторонняя критическая область''' определяется интервалом <tex>\Omega = (t_{1-\alpha},\;+\infty)</tex>.
 +
== Ошибки первого и второго рода ==
== Ошибки первого и второго рода ==
-
* Ошибка первого рода или «ложная тревога» (англ. type I error, <tex>\alpha</tex>&nbsp;error, false positive) — когда нулевая гипотеза отвергается, хотя на самом деле она верна.
 
-
* Ошибка второго рода или «пропуск цели» (англ. type II error, <tex>\beta</tex>&nbsp;error, false negative) — когда нулевая гипотеза принимается, хотя на самом деле она не верна.
 
 +
* '''Ошибка первого рода''' или «ложная тревога» (англ. type I error, <tex>\alpha</tex>&nbsp;error, false positive) — когда нулевая гипотеза отвергается, хотя на самом деле она верна.
 +
 +
* '''Ошибка второго рода''' или «пропуск цели» (англ. type II error, <tex>\beta</tex>&nbsp;error, false negative) — когда нулевая гипотеза принимается, хотя на самом деле она не верна.
 +
 +
<center>
{| class = "standard"
{| class = "standard"
|+
|+
Строка 47: Строка 74:
| style="background: #ddffdd;" | <tex>H_1</tex> верно принята
| style="background: #ddffdd;" | <tex>H_1</tex> верно принята
|}
|}
 +
</center>
== Свойства статистических критериев ==
== Свойства статистических критериев ==
-
Несмещённый критерий
+
'''Мощность критерия'''
 +
определяется как вероятность отклонить гипотезу&nbsp;<tex>H_0</tex>, если на самом деле верна альтернативная гипотеза&nbsp;<tex>H</tex>:
 +
::<tex>\beta(H) = \mathbb{P}\left\{ T\in\Omega | H \right\}.</tex>
 +
Таким образом, ''мощность критерия'' является числовой функцией от альтернативной гипотезы&nbsp;<tex>H</tex>.
 +
 +
Вероятность ошибки первого рода равна <tex>\beta(H_0)</tex>.
 +
 
 +
Вероятность ошибки второго рода равна <tex>1 - \beta(H_1)</tex>.
-
Состоятельный критерий
+
'''Несмещённый критерий''':
 +
<tex>\beta(H) > \alpha</tex> для всех альтернатив&nbsp;<tex>H</tex>.
-
Мощность критерия
+
'''Состоятельный критерий''':
 +
<tex>\beta(H) \to \infty</tex> при <tex>m\to\infty</tex> для всех альтернатив&nbsp;<tex>H</tex>.
-
Равномерно более мощный критерий
+
'''Равномерно более мощный критерий.'''
 +
Говорят, что критерий с мощностью <tex>\beta(H)</tex> является равномерно более мощным, чем критерий с мощностью <tex>\beta'(H)</tex>, если выполняются два условия:
 +
#<tex>\beta(H_0) = \beta'(H_0)</tex>;
 +
#<tex>\beta(H_1) \geq \beta'(H_1)</tex> для всех рассматриваемых альтернатив <tex>H_1\neq H_0</tex>, причём хотя бы для одной альтернативы неравенство строгое.
== Типы статистических критериев ==
== Типы статистических критериев ==
 +
{{UnderConstruction|[[Участник:Vokov|К.В.Воронцов]] 23:20, 7 августа 2008 (MSD)}}
Критерии согласия
Критерии согласия

Версия 19:20, 7 августа 2008

Содержание

Статистическая гипотеза (statistical hypothesys) — это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных.

Проверка статистической гипотезы (testing statistical hypotheses) — это процесс принятия решения о том, что рассматриваемая статистическая гипотеза не противоречит наблюдаемой выборке данных.

Статистический тест или статистический критерий — строгое математическое правило, по которому принимается или отвергается статистическая гипотеза.

Методика проверки статистических гипотез

Пусть задана случайная выборка x^m = (x_1,\ldots,x_m) — последовательность m объектов из множества X. Предполагается, что на множестве X существует некоторая неизвестная вероятностная мера \mathbb{P}.

Методика состоит в следующем.

  1. Формулируется нулевая гипотеза H_0 о распределении вероятностей на множестве X. Гипотеза формулируется исходя из требований прикладной задачи. Чаще всего рассматриваются две гипотезы — основная или нулевая H_0 и альтернативная H_1. Иногда альтернатива не формулируется в явном виде; тогда предполагается, что H_1 означает «не H_0». Иногда рассматривается сразу несколько альтернатив. В математической статистике хорошо изучено несколько десятков «наиболее часто встречающихся» типов гипотез, и известны ещё сотни специальных вариантов и разновидностей. Примеры приводятся ниже.
  2. Задаётся некоторая статистика (функция выборки) T:\: X^m \to \mathbb{R}, для которой в условиях справедливости гипотезы H_0 выводится функция распределения F(T) и/или плотность распределения p(T). Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, часто не имеет однозначного ответа. Есть целый ряд требований, которым должна удовлетворять «хорошая» статистика T. Вывод функции распределения F(T) при заданных H_0 и T является строгой математической задачей, которая решается методами теории вероятностей; в справочниках приводятся готовые формулы для F(T); в статистических пакетах имеются готовые вычислительные процедуры.
  3. Фиксируется уровень значимости — допустимая для данной задачи вероятность ошибки первого рода, то есть того, что гипотеза на самом деле верна, но будет отвергнута процедурой проверки. Это должно быть достаточно малое число \alpha \in [0,1]. На практике часто полагают \alpha=0.05.
  4. На множестве допустимых значений статистики T выделяется критическое множество \Omega наименее вероятных значений статистики T, такое, что \mathbb{P}\{T\in\Omega\} = \alpha. Вычисление границ критического множества является строгой математической задачей, которая в большинстве практических случаев имеет готовое простое решение.
  5. Собственно статистический тест (статистический критерий) заключается в проверке условия:
    • если T(X^m)\in\Omega, то делается вывод «данные противоречат нулевой гипотезе при уровне значимости \alpha».
    • если T(X^m)\notin\Omega, то делается вывод «данные не противоречат нулевой гипотезе при уровне значимости \alpha».

Итак, статистический критерий определяется статистикой T и критическим множеством \Omega, которое зависит от уровня значимости.

Замечание. Если данные не противоречат нулевой гипотезе, это ещё не значит, что гипотеза верна. Тому есть две причины.

  • По мере увеличения длины выборки нулевая гипотеза может сначала приниматься, но потом выявятся более тонкие несоответствия данных гипотезе, и она будет отвергнута. То есть многое зависит от объёма данных; если данных не хватает, можно принять даже самую неправдоподобную гипотезу.
  • Выбранная статистика T может отражать не всю информацию, содержащуюся в гипотезе H_0. В таком случае увеличивается вероятность ошибки второго рода — нулевая гипотеза может быть принята, хотя на самом деле она не верна. Допустим, например, что H_0 = «распределение нормально»; T(X^m) = коэффициент асимметрии; тогда выборка с любым симметричным распределением будет признана нормальной. Чтобы избегать таких ошибок, следует пользоваться более мощными критериями.

Типы статистических гипотез

  • Простая гипотеза однозначно определяет функцию распределения на множестве X.
  • Сложная гипотеза утверждает принадлежность распределения к некоторому множеству распределений на X.

Типы критической области

Обозначим через t_z значение, которое находится из условия F(t_z) = \mathbb{P}\left\{ T<t_z \right\} = z, где F — функция распределения статистики T. Фактически, t_z есть обратная функция: t_z = F^{-1}(z).

На практике, как правило, используются статистики T с унимодальной плотностью распределения, то есть плотностью, имеющей форму пика. Критические области (наименее вероятные значения статистики) соответствуют хвостам распределения. Поэтому чаще всего возникают критические области одного из трёх типов:

  • Двусторонняя критическая область определяется двумя интервалами \Omega = (-\infty,\;t_{\alpha/2})\cup(t_{1-\alpha/2}\;+\infty).
  • Левосторонняя критическая область определяется интервалом \Omega = (-\infty,\; t_\alpha).
  • Правосторонняя критическая область определяется интервалом \Omega = (t_{1-\alpha},\;+\infty).


Ошибки первого и второго рода

  • Ошибка первого рода или «ложная тревога» (англ. type I error, \alpha error, false positive) — когда нулевая гипотеза отвергается, хотя на самом деле она верна.
  • Ошибка второго рода или «пропуск цели» (англ. type II error, \beta error, false negative) — когда нулевая гипотеза принимается, хотя на самом деле она не верна.
  Верная гипотеза
 H_0   H_1 
Результат
 применения 
критерия
 H_0  H_0 верно принята H_1 неверно отвергнута 
(Ошибка второго рода)
 H_1  H_0 неверно отвергнута 
(Ошибка первого рода)
H_1 верно принята

Свойства статистических критериев

Мощность критерия определяется как вероятность отклонить гипотезу H_0, если на самом деле верна альтернативная гипотеза H:

\beta(H) = \mathbb{P}\left\{ T\in\Omega | H \right\}.

Таким образом, мощность критерия является числовой функцией от альтернативной гипотезы H.

Вероятность ошибки первого рода равна \beta(H_0).

Вероятность ошибки второго рода равна 1 - \beta(H_1).

Несмещённый критерий: \beta(H) > \alpha для всех альтернатив H.

Состоятельный критерий: \beta(H) \to \infty при m\to\infty для всех альтернатив H.

Равномерно более мощный критерий. Говорят, что критерий с мощностью \beta(H) является равномерно более мощным, чем критерий с мощностью \beta'(H), если выполняются два условия:

  1. \beta(H_0) = \beta'(H_0);
  2. \beta(H_1) \geq \beta'(H_1) для всех рассматриваемых альтернатив H_1\neq H_0, причём хотя бы для одной альтернативы неравенство строгое.

Типы статистических критериев

Статья в настоящий момент дорабатывается.
К.В.Воронцов 23:20, 7 августа 2008 (MSD)


Критерии согласия

Критерии нормальности

Критерии равномерности

Критерии симметрии

Критерии однородности

Критерии случайности

Критерии стационарности


Статья в настоящий момент дорабатывается.
К.В.Воронцов 20:52, 7 августа 2008 (MSD)


Литература

  1. Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
  2. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.

Ссылки