Пи-величина
Материал из MachineLearning.
Пи-величина (p-value) — это наименьшая величина уровня значимости, при которой нулевая гипотеза отвергается для данного значения статистики критерия .
где — критическая область критерия.
Другая интерпретация: пи-величина — это вероятность, с которой (при условии истинности нулевой гипотезы) могла бы реализоваться наблюдаемая выборка, или любая другая выборка с ещё менее вероятным значением статистики .
Случайная величина имеет равномерное распределение. Фактически, функция приводит значение статистики критерия к шкале вероятности. Маловероятным значениям (хвостам распределения) статистики соотвествуют значения , близкие к нулю или к единице.
Некоторые типичные заблуждения, связанные со значением пи-величины:
- пи-величина не равна вероятности истинности нулевой гипотезы; частотная статистика вообще не имеет права приписывать вероятности гипотезам;
- 1 – (пи-величина) не равно вероятности истинности альтернативной гипотезы;
- пи-величина не равна вероятности ошибки первого рода;
- 1 – (пи-величина) не равно вероятности ошибки второго рода;
- пи-величина не есть вероятность того, что повторный эксперимент не приведёт к тому же решению;
Литература
- Кобзарь А. И. Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.: Физматлит, 2006.
- Цейтлин Н. А. Из опыта аналитического статистика. — М.: Солар, 2006. — 905 с.
- Алимов Ю. И. Альтернатива методу математической статистики. — М.: Знание, 1980.
Ссылки
- Проверка статистических гипотез — о стандартной методике проверки статистических гипотез.
- P-value — статья в англоязычной Википедии.
- ROC curve — статья в англоязычной Википедии.