Достигаемый уровень значимости

Материал из MachineLearning.

(Различия между версиями)

Версия 18:42, 1 октября 2009

Основная статья: Проверка статистических гипотез

Достигаемый уровень значимости (пи-величина, англ. p-value) — это наименьшая величина уровня значимости, при которой нулевая гипотеза отвергается для данного значения статистики критерия $T$ .

$p(T) = \min \{ \alpha:\: T\in\Omega_\alpha \},$

где $\Omega_\alpha$ — критическая область критерия.

Другая интерпретация: достигаемый уровень значимости $p(T)$ — это вероятность, с которой (при условии истинности нулевой гипотезы) могла бы реализоваться наблюдаемая выборка, или любая другая выборка с ещё менее вероятным значением статистики $T$ .

Случайная величина $p(T(x^m))$ имеет равномерное распределение. Фактически, функция $p(T)$ приводит значение статистики критерия $T$ к шкале вероятности. Маловероятным значениям (хвостам распределения) статистики $T$ соотвествуют значения $p(T)$ , близкие к нулю.

Некоторые типичные заблуждения, связанные со значением пи-величины:

достигаемый уровень значимости не равен вероятности истинности нулевой гипотезы; частотная статистика вообще не имеет права приписывать вероятности гипотезам;
1 – (достигаемый уровень значимости) не равно вероятности истинности альтернативной гипотезы;
достигаемый уровень значимости не равен вероятности ошибки первого рода;
1 – (достигаемый уровень значимости) не равно вероятности ошибки второго рода;
достигаемый уровень значимости не есть вероятность того, что повторный эксперимент не приведёт к тому же решению.

Как правило, в практических задачах нет никакого разумного правила для выбора фиксированного уровня значимости. Выбирая метод достигаемого уровня значимости, мы можем сделать процедуру принятия решения более гибкой - чем меньшее значение $p(T)$ мы наблюдаем, тем сильнее свидетельствует совокупность наблюдений против нулевой гипотезы. Использование достигаемого уровня значимости вместо метода процентных точек рекомендуется нормативными документами Всероссийского научно-исследовательского института сертификации с 1987 года.

Литература

Кобзарь А. И. Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.: Физматлит, 2006. — 816 с.
Цейтлин Н. А. Из опыта аналитического статистика. — М.: Солар, 2006. — 905 с.
Всероссийский научно-исследовательский институт сертификации. Рекомендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики. - М.: ВНИИС, 1987.

Ссылки

Проверка статистических гипотез — о стандартной методике проверки статистических гипотез.
P-value — статья в англоязычной Википедии.

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%94%D0%BE%D1%81%D1%82%D0%B8%D0%B3%D0%B0%D0%B5%D0%BC%D1%8B%D0%B9_%D1%83%D1%80%D0%BE%D0%B2%D0%B5%D0%BD%D1%8C_%D0%B7%D0%BD%D0%B0%D1%87%D0%B8%D0%BC%D0%BE%D1%81%D1%82%D0%B8»

Категория: Прикладная статистика

@@ Строка 28: / Строка 28: @@
 # ''Кобзарь А. И.'' Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.:&nbsp;Физматлит, 2006. — 816&nbsp;с.
 # ''Цейтлин Н. А.'' [http://freenet-homepage.de/nzarchiv/ Из опыта аналитического статистика]. — М.:&nbsp;Солар, 2006. — 905&nbsp;с.
-# ''Всероссийский научно-исследовательский институт сертификации.'' Рекоммендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики. - М.:&nbsp;ВНИИС, 1987.
+# ''Всероссийский научно-исследовательский институт сертификации.'' Рекомендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики. - М.:&nbsp;ВНИИС, 1987.

Достигаемый уровень значимости

Материал из MachineLearning.

Версия 18:42, 1 октября 2009

Литература

Ссылки

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты