Пи-величина
Материал из MachineLearning.
Строка 3: | Строка 3: | ||
'''Достигаемый уровень значимости''' (пи-величина, англ. p-value) — это наименьшая величина [[уровень значимости|уровня значимости]], | '''Достигаемый уровень значимости''' (пи-величина, англ. p-value) — это наименьшая величина [[уровень значимости|уровня значимости]], | ||
при которой [[нулевая гипотеза]] отвергается для данного значения ''статистики критерия'' <tex>T</tex>. | при которой [[нулевая гипотеза]] отвергается для данного значения ''статистики критерия'' <tex>T</tex>. | ||
- | ::<tex> | + | ::<tex>p(T) = \min \{ \alpha:\: T\in\Omega_\alpha \},</tex> |
где | где | ||
<tex>\Omega_\alpha</tex> — ''критическая область'' критерия. | <tex>\Omega_\alpha</tex> — ''критическая область'' критерия. | ||
Другая интерпретация: | Другая интерпретация: | ||
- | '' | + | ''достигаемый уровень значимости'' <tex>\p(T)</tex> — это вероятность, с которой (при условии истинности ''нулевой гипотезы'') могла бы реализоваться наблюдаемая выборка, или любая другая выборка с ещё менее вероятным значением статистики <tex>T</tex>. |
- | Случайная величина <tex>\ | + | Случайная величина <tex>\p(T(x^m))</tex> имеет равномерное распределение. |
- | Фактически, функция <tex>\ | + | Фактически, функция <tex>\p(T)</tex> приводит значение статистики критерия <tex>T</tex> к шкале вероятности. |
- | Маловероятным значениям (хвостам распределения) статистики <tex>T</tex> соотвествуют значения <tex>\ | + | Маловероятным значениям (хвостам распределения) статистики <tex>T</tex> соотвествуют значения <tex>\p(T)</tex>, близкие к нулю. |
Некоторые типичные заблуждения, связанные со значением пи-величины: | Некоторые типичные заблуждения, связанные со значением пи-величины: |
Версия 10:34, 30 апреля 2009
Достигаемый уровень значимости (пи-величина, англ. p-value) — это наименьшая величина уровня значимости, при которой нулевая гипотеза отвергается для данного значения статистики критерия .
где — критическая область критерия.
Другая интерпретация: достигаемый уровень значимости — это вероятность, с которой (при условии истинности нулевой гипотезы) могла бы реализоваться наблюдаемая выборка, или любая другая выборка с ещё менее вероятным значением статистики .
Случайная величина имеет равномерное распределение. Фактически, функция приводит значение статистики критерия к шкале вероятности. Маловероятным значениям (хвостам распределения) статистики соотвествуют значения , близкие к нулю.
Некоторые типичные заблуждения, связанные со значением пи-величины:
- достигаемый уровень значимости не равен вероятности истинности нулевой гипотезы; частотная статистика вообще не имеет права приписывать вероятности гипотезам;
- 1 – (достигаемый уровень значимости) не равно вероятности истинности альтернативной гипотезы;
- достигаемый уровень значимости не равен вероятности ошибки первого рода;
- 1 – (достигаемый уровень значимости) не равно вероятности ошибки второго рода;
- достигаемый уровень значимости не есть вероятность того, что повторный эксперимент не приведёт к тому же решению;
Литература
- Кобзарь А. И. Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.: Физматлит, 2006. — 816 с.
- Цейтлин Н. А. Из опыта аналитического статистика. — М.: Солар, 2006. — 905 с.
Ссылки
- Проверка статистических гипотез — о стандартной методике проверки статистических гипотез.
- P-value — статья в англоязычной Википедии.