Достигаемый уровень значимости
Материал из MachineLearning.
м |
м |
||
(3 промежуточные версии не показаны) | |||
Строка 2: | Строка 2: | ||
'''Достигаемый уровень значимости''' (пи-величина, англ. p-value) — это наименьшая величина [[уровень значимости|уровня значимости]], | '''Достигаемый уровень значимости''' (пи-величина, англ. p-value) — это наименьшая величина [[уровень значимости|уровня значимости]], | ||
- | при которой [[нулевая гипотеза]] отвергается для данного значения | + | при которой [[нулевая гипотеза]] отвергается для данного значения [[Статистика (функция выборки)|статистики критерия]] <tex>T:</tex> |
::<tex>p(T) = \min \{ \alpha:\: T\in\Omega_\alpha \},</tex> | ::<tex>p(T) = \min \{ \alpha:\: T\in\Omega_\alpha \},</tex> | ||
где | где | ||
- | <tex>\Omega_\alpha</tex> — | + | <tex>\Omega_\alpha</tex> — критическая область критерия. |
Другая интерпретация: | Другая интерпретация: | ||
- | + | достигаемый уровень значимости <tex>p(T)</tex> — это вероятность при справедливости [[нулевая гипотеза|нулевой гипотезы]] получить значение статистики, такое же или ещё более экстремальное, чем <tex>T</tex> (условно, <tex>p(T) = \mathbb{P}(T|H_0)</tex>). | |
Случайная величина <tex>p(T(x^m))</tex> имеет равномерное распределение. | Случайная величина <tex>p(T(x^m))</tex> имеет равномерное распределение. | ||
Фактически, функция <tex>p(T)</tex> приводит значение статистики критерия <tex>T</tex> к шкале вероятности. | Фактически, функция <tex>p(T)</tex> приводит значение статистики критерия <tex>T</tex> к шкале вероятности. | ||
- | Маловероятным значениям (хвостам распределения) статистики <tex>T</tex> соотвествуют значения <tex>p(T)</tex> | + | Маловероятным значениям (хвостам распределения) статистики <tex>T</tex> соотвествуют значения <tex>p(T),</tex> близкие к нулю. |
Некоторые типичные заблуждения, связанные со значением пи-величины: | Некоторые типичные заблуждения, связанные со значением пи-величины: | ||
- | * достигаемый уровень значимости не равен вероятности истинности нулевой гипотезы; | + | * достигаемый уровень значимости не равен вероятности истинности нулевой гипотезы <tex>\left(p(T) = \mathbb{P}(T|H_0) \neq \mathbb{P}(H_0|T)\right)</tex>; классическая статистика, в отличие от байесовской, не может приписывать вероятности гипотезам; |
* 1 – (достигаемый уровень значимости) не равно вероятности истинности альтернативной гипотезы; | * 1 – (достигаемый уровень значимости) не равно вероятности истинности альтернативной гипотезы; | ||
* достигаемый уровень значимости не равен вероятности ошибки первого рода; | * достигаемый уровень значимости не равен вероятности ошибки первого рода; | ||
* 1 – (достигаемый уровень значимости) не равно вероятности ошибки второго рода; | * 1 – (достигаемый уровень значимости) не равно вероятности ошибки второго рода; | ||
- | * достигаемый уровень значимости не есть вероятность того, что повторный эксперимент не приведёт к тому же решению | + | * достигаемый уровень значимости не есть вероятность того, что повторный эксперимент не приведёт к тому же решению. |
+ | |||
+ | Как правило, в практических задачах нет никакого разумного правила для выбора фиксированного уровня | ||
+ | значимости. Выбирая метод достигаемого уровня значимости, мы можем сделать процедуру принятия решения более гибкой –- чем меньшее значение <tex>p(T)</tex> мы наблюдаем, тем сильнее свидетельствует совокупность наблюдений против нулевой гипотезы. Использование достигаемого уровня значимости вместо метода процентных точек рекомендуется нормативными документами Всероссийского научно-исследовательского института сертификации с 1987 года. | ||
== Литература == | == Литература == | ||
# ''Кобзарь А. И.'' Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.: Физматлит, 2006. — 816 с. | # ''Кобзарь А. И.'' Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.: Физматлит, 2006. — 816 с. | ||
# ''Цейтлин Н. А.'' [http://freenet-homepage.de/nzarchiv/ Из опыта аналитического статистика]. — М.: Солар, 2006. — 905 с. | # ''Цейтлин Н. А.'' [http://freenet-homepage.de/nzarchiv/ Из опыта аналитического статистика]. — М.: Солар, 2006. — 905 с. | ||
+ | # ''Всероссийский научно-исследовательский институт сертификации.'' Рекомендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики. — М.: ВНИИС, 1987. | ||
== Ссылки == | == Ссылки == | ||
- | |||
* [http://en.wikipedia.org/wiki/P-value P-value] — статья в англоязычной Википедии. | * [http://en.wikipedia.org/wiki/P-value P-value] — статья в англоязычной Википедии. | ||
[[Категория:Прикладная статистика]] | [[Категория:Прикладная статистика]] |
Текущая версия
Достигаемый уровень значимости (пи-величина, англ. p-value) — это наименьшая величина уровня значимости, при которой нулевая гипотеза отвергается для данного значения статистики критерия
где — критическая область критерия.
Другая интерпретация: достигаемый уровень значимости — это вероятность при справедливости нулевой гипотезы получить значение статистики, такое же или ещё более экстремальное, чем (условно, ).
Случайная величина имеет равномерное распределение. Фактически, функция приводит значение статистики критерия к шкале вероятности. Маловероятным значениям (хвостам распределения) статистики соотвествуют значения близкие к нулю.
Некоторые типичные заблуждения, связанные со значением пи-величины:
- достигаемый уровень значимости не равен вероятности истинности нулевой гипотезы ; классическая статистика, в отличие от байесовской, не может приписывать вероятности гипотезам;
- 1 – (достигаемый уровень значимости) не равно вероятности истинности альтернативной гипотезы;
- достигаемый уровень значимости не равен вероятности ошибки первого рода;
- 1 – (достигаемый уровень значимости) не равно вероятности ошибки второго рода;
- достигаемый уровень значимости не есть вероятность того, что повторный эксперимент не приведёт к тому же решению.
Как правило, в практических задачах нет никакого разумного правила для выбора фиксированного уровня значимости. Выбирая метод достигаемого уровня значимости, мы можем сделать процедуру принятия решения более гибкой –- чем меньшее значение мы наблюдаем, тем сильнее свидетельствует совокупность наблюдений против нулевой гипотезы. Использование достигаемого уровня значимости вместо метода процентных точек рекомендуется нормативными документами Всероссийского научно-исследовательского института сертификации с 1987 года.
Литература
- Кобзарь А. И. Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.: Физматлит, 2006. — 816 с.
- Цейтлин Н. А. Из опыта аналитического статистика. — М.: Солар, 2006. — 905 с.
- Всероссийский научно-исследовательский институт сертификации. Рекомендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики. — М.: ВНИИС, 1987.
Ссылки
- P-value — статья в англоязычной Википедии.