Пи-величина
Материал из MachineLearning.
Достигаемый уровень значимости (англ. p-value) — это наименьшая величина уровня значимости,
при которой нулевая гипотеза отвергается для данного значения статистики критерия .
где
— критическая область критерия.
Другая интерпретация:
достигаемый уровень значимости — это вероятность, с которой (при условии истинности нулевой гипотезы) могла бы реализоваться наблюдаемая выборка, или любая другая выборка с ещё менее вероятным значением статистики
.
Случайная величина имеет равномерное распределение.
Фактически, функция
приводит значение статистики критерия
к шкале вероятности.
Маловероятным значениям (хвостам распределения) статистики
соотвествуют значения
, близкие к нулю.
Некоторые типичные заблуждения, связанные со значением достигаемого уровня значимости:
- достигаемый уровень значимости не равен вероятности истинности нулевой гипотезы; частотная статистика вообще не имеет права приписывать вероятности гипотезам;
- 1 – (достигаемый уровень значимости) не равно вероятности истинности альтернативной гипотезы;
- достигаемый уровень значимости не равен вероятности ошибки первого рода;
- 1 – (достигаемый уровень значимости) не равно вероятности ошибки второго рода;
- достигаемый уровень значимости не есть вероятность того, что повторный эксперимент не приведёт к тому же решению.
Использование достигаемого уровня значимости взамен фиксированных «процентных точек» рекомендовано Всероссийским научно-исследовательским институтом сертификации ещё в 1987 году.
Литература
- Кобзарь А. И. Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.: Физматлит, 2006. — 816 с.
- Цейтлин Н. А. Из опыта аналитического статистика. — М.: Солар, 2006. — 905 с.
Ссылки
- Проверка статистических гипотез — о стандартной методике проверки статистических гипотез.
- P-value — статья в англоязычной Википедии.