Проверка статистических гипотез
Материал из MachineLearning.
|
Статистическая гипотеза (statistical hypothesys) — определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных.
Проверка статистических гипотез (testing statistical hypotheses) — методология принятия решений о том, что рассматриваемая статистическая гипотеза не противоречит наблюдаемой выборке данных. Чаще всего рассматриваются две гипотезы — основная или нулевая и альтернативная . Иногда альтернатива не формулируется в явном виде; тогда предполагается, что означает «не ». Иногда рассматривается сразу несколько альтернатив.
Методология
Пусть задана случайная выборка — последовательность объектов из множества , на котором существует (но не известна) вероятностная мера .
Общая методика состоит в следующем.
- Формулируется нулевая гипотеза о распределении вероятностей на множестве . Собственно, это именно то, что мы собираемся проверить. Гипотеза формулируется исходя из требований прикладной задачи. В математической статистике хорошо изучено несколько десятков «наиболее часто встречающихся» типов гипотез, и известны ещё сотни специальных вариантов и разновидностей.
- Задаётся некоторая статистика , для которой в условиях справедливости гипотезы выводится функция распределения и/или плотность распределения . Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, часто не имеет однозначного ответа. Есть целый ряд требований, предъявляемых к «хорошей» статистике . Задача получения функции распределения при заданных и является строго поставленной математической задачей, которая решается методами теории вероятностей; в справочниках приводятся готовые формулы; в статистических пакетах имеются готовые вычислительные процедуры.
- Фиксируется уровень значимости — число из отрезка , которое можно интерпретировать как «достаточно малую вероятность». Её выбирают исходя из априорных соображений риска, допустимого для принимаемого решения в данной прикладной задаче. Часто полагают .
- На множестве допустимых значений статистики выделяется критическое множество наименее вероятных значений такое, что . Вычисление вида критического множества также является строгой математической задачей, решение которой для большинства практических случаев известно.
- Статистический тест
Статья в настоящий момент дорабатывается. К.В.Воронцов 23:18, 6 августа 2008 (MSD) |
Литература
- Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.