Критерий хи-квадрат
Материал из MachineLearning.
|
![]() | Статья в настоящий момент дорабатывается. Венжега Андрей 00:08, 14 ноября 2008 (MSK) |
Определение
Пусть дана случайная величина X .
Гипотеза : с. в. X подчиняется закону распределения
.
Для проверки гипотезы рассмотрим выборку, состоящую из n независимых наблюдений над с.в. X:
.
По выборке построим эмпирическое распределение
с.в X. Сравнение эмпирического
и теоретического распределения
производится с помощью специально подобранной случайной величины — критерия согласия. Рассмотрим критерий согласия Пирсона (критерий
):
Гипотеза : Хn порождается функцией
.
Разделим [a,b] на k непересекающихся интервалов ;
Пусть - количество наблюдений в j-м интервале:
;
- вероятность попадания наблюдения в j-ый интервал при выполнении гипотезы
;
Ожидаемое число попаданий в j-ый интервал;
Статистика: - Распределение хи-квадрат с k-1 степенью свободы.
Критерий - наиболее часто используемый статистический критерй для проверки гипотезы
, что наблюдаемая случайная величина подчиняется некому теоретическому закону распределению.
Проверка гипотезы
В зависимости от значения критерия , может выполняться одна из гипотез:
- гипотеза неслучайности
, гипотеза
выполняется.
- гипотеза случайности
(попадает в левый "хвост" распределения) гипотеза
отвергается.
- гипотеза согласия
(попадает в левый "хвост" распределения) гипотеза
отвергается.