Достигаемый уровень значимости

Материал из MachineLearning.

(Различия между версиями)

Текущая версия

Основная статья: Проверка статистических гипотез

Достигаемый уровень значимости (пи-величина, англ. p-value) — это наименьшая величина уровня значимости, при которой нулевая гипотеза отвергается для данного значения статистики критерия $T:$

$p(T) = \min \{ \alpha:\: T\in\Omega_\alpha \},$

где $\Omega_\alpha$ — критическая область критерия.

Другая интерпретация: достигаемый уровень значимости $p(T)$ — это вероятность при справедливости нулевой гипотезы получить значение статистики, такое же или ещё более экстремальное, чем $T$ (условно, $p(T) = \mathbb{P}(T|H_0)$ ).

Случайная величина $p(T(x^m))$ имеет равномерное распределение. Фактически, функция $p(T)$ приводит значение статистики критерия $T$ к шкале вероятности. Маловероятным значениям (хвостам распределения) статистики $T$ соотвествуют значения $p(T),$ близкие к нулю.

Некоторые типичные заблуждения, связанные со значением пи-величины:

достигаемый уровень значимости не равен вероятности истинности нулевой гипотезы $\left(p(T) = \mathbb{P}(T|H_0) \neq \mathbb{P}(H_0|T)\right)$ ; классическая статистика, в отличие от байесовской, не может приписывать вероятности гипотезам;
1 – (достигаемый уровень значимости) не равно вероятности истинности альтернативной гипотезы;
достигаемый уровень значимости не равен вероятности ошибки первого рода;
1 – (достигаемый уровень значимости) не равно вероятности ошибки второго рода;
достигаемый уровень значимости не есть вероятность того, что повторный эксперимент не приведёт к тому же решению.

Как правило, в практических задачах нет никакого разумного правила для выбора фиксированного уровня значимости. Выбирая метод достигаемого уровня значимости, мы можем сделать процедуру принятия решения более гибкой –- чем меньшее значение $p(T)$ мы наблюдаем, тем сильнее свидетельствует совокупность наблюдений против нулевой гипотезы. Использование достигаемого уровня значимости вместо метода процентных точек рекомендуется нормативными документами Всероссийского научно-исследовательского института сертификации с 1987 года.

Литература

Кобзарь А. И. Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.: Физматлит, 2006. — 816 с.
Цейтлин Н. А. Из опыта аналитического статистика. — М.: Солар, 2006. — 905 с.
Всероссийский научно-исследовательский институт сертификации. Рекомендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики. — М.: ВНИИС, 1987.

Ссылки

P-value — статья в англоязычной Википедии.

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%94%D0%BE%D1%81%D1%82%D0%B8%D0%B3%D0%B0%D0%B5%D0%BC%D1%8B%D0%B9_%D1%83%D1%80%D0%BE%D0%B2%D0%B5%D0%BD%D1%8C_%D0%B7%D0%BD%D0%B0%D1%87%D0%B8%D0%BC%D0%BE%D1%81%D1%82%D0%B8»

Категория: Прикладная статистика

@@ Строка 2: / Строка 2: @@
 '''Достигаемый уровень значимости''' (пи-величина, англ. p-value) — это наименьшая величина [[уровень значимости|уровня значимости]],
-при которой [[нулевая гипотеза]] отвергается для данного значения ''статистики критерия''&nbsp;<tex>T</tex>.
+при которой [[нулевая гипотеза]] отвергается для данного значения [[Статистика (функция выборки)|статистики критерия]]&nbsp;<tex>T:</tex>
 ::<tex>p(T) = \min \{ \alpha:\: T\in\Omega_\alpha \},</tex>
 где
-<tex>\Omega_\alpha</tex> — ''критическая область'' критерия.
+<tex>\Omega_\alpha</tex> — критическая область критерия.
 Другая интерпретация:
-''достигаемый уровень значимости''&nbsp;<tex>p(T)</tex> — это вероятность, с которой (при условии истинности ''нулевой гипотезы'') могла бы реализоваться наблюдаемая выборка, или любая другая выборка с ещё менее вероятным значением статистики&nbsp;<tex>T</tex>.
+достигаемый уровень значимости <tex>p(T)</tex> — это вероятность при справедливости [[нулевая гипотеза|нулевой гипотезы]] получить значение статистики, такое же или ещё более экстремальное, чем&nbsp;<tex>T</tex> (условно, <tex>p(T) = \mathbb{P}(T|H_0)</tex>).
 Случайная величина <tex>p(T(x^m))</tex> имеет равномерное распределение.
 Фактически, функция <tex>p(T)</tex> приводит значение статистики критерия&nbsp;<tex>T</tex> к шкале вероятности.
-Маловероятным значениям (хвостам распределения) статистики&nbsp;<tex>T</tex> соотвествуют значения <tex>p(T)</tex>, близкие к нулю.
+Маловероятным значениям (хвостам распределения) статистики&nbsp;<tex>T</tex> соотвествуют значения <tex>p(T),</tex> близкие к нулю.
 Некоторые типичные заблуждения, связанные со значением пи-величины:
-* достигаемый уровень значимости не равен вероятности истинности нулевой гипотезы; частотная статистика вообще не имеет права приписывать вероятности гипотезам;
+* достигаемый уровень значимости не равен вероятности истинности нулевой гипотезы <tex>\left(p(T) = \mathbb{P}(T|H_0) \neq \mathbb{P}(H_0|T)\right)</tex>; классическая статистика, в отличие от байесовской, не может приписывать вероятности гипотезам;
 * 1&nbsp;–&nbsp;(достигаемый уровень значимости) не равно вероятности истинности альтернативной гипотезы;
 * достигаемый уровень значимости не равен вероятности ошибки первого рода;
 * 1&nbsp;–&nbsp;(достигаемый уровень значимости) не равно вероятности ошибки второго рода;
-* достигаемый уровень значимости не есть вероятность того, что повторный эксперимент не приведёт к тому же решению;
+* достигаемый уровень значимости не есть вероятность того, что повторный эксперимент не приведёт к тому же решению.
+Как правило, в практических задачах нет никакого разумного правила для выбора фиксированного уровня
+значимости. Выбирая метод достигаемого уровня значимости, мы можем сделать процедуру принятия решения более гибкой –- чем меньшее значение <tex>p(T)</tex> мы наблюдаем, тем сильнее свидетельствует совокупность наблюдений против нулевой гипотезы. Использование достигаемого уровня значимости вместо метода процентных точек рекомендуется нормативными документами Всероссийского научно-исследовательского института сертификации с 1987 года.
 == Литература ==
 # ''Кобзарь А. И.'' Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.:&nbsp;Физматлит, 2006. — 816&nbsp;с.
 # ''Цейтлин Н. А.'' [http://freenet-homepage.de/nzarchiv/ Из опыта аналитического статистика]. — М.:&nbsp;Солар, 2006. — 905&nbsp;с.
+# ''Всероссийский научно-исследовательский институт сертификации.'' Рекомендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики. — М.:&nbsp;ВНИИС, 1987.
 == Ссылки ==
-* [[Проверка статистических гипотез]] — о стандартной методике проверки статистических гипотез.
 * [http://en.wikipedia.org/wiki/P-value P-value] — статья в англоязычной Википедии.
 [[Категория:Прикладная статистика]]

Достигаемый уровень значимости

Материал из MachineLearning.

Текущая версия

Литература

Ссылки

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты