Критерий хи-квадрат
Материал из MachineLearning.
(→Определение) |
(→Проверка гипотезы) |
||
Строка 27: | Строка 27: | ||
'''Статистика:''' <tex>\chi^2 = \sum_{i=1}^k \frac{ \left( n_j-E_j \right)^2}{E_j} \sim \chi_{k-1}^2</tex> - [[Распределение хи-квадрат|Распределение хи-квадрат]] с k-1 степенью свободы. | '''Статистика:''' <tex>\chi^2 = \sum_{i=1}^k \frac{ \left( n_j-E_j \right)^2}{E_j} \sim \chi_{k-1}^2</tex> - [[Распределение хи-квадрат|Распределение хи-квадрат]] с k-1 степенью свободы. | ||
- | == Проверка гипотезы == | + | == Проверка гипотезы <tex>H_0</tex> == |
[[Изображение:Chi-square.png|280px|thumb|Распределение хи-квадрат]] | [[Изображение:Chi-square.png|280px|thumb|Распределение хи-квадрат]] | ||
- | В зависимости от значения критерия <tex>\chi^2</tex>, может | + | В зависимости от значения критерия <tex>\chi^2</tex>, гипотеза <tex>H_0</tex> может приниматься, либо отвергаться: |
- | * | + | * <tex>\chi^2_1 < \chi^2 < \chi^2_2</tex>, гипотеза <tex>H_0</tex> выполняется. |
- | <tex>\chi^2_1 < \chi^2 < \chi^2_2</tex>, гипотеза <tex>H_0</tex> выполняется. | + | |
- | * | + | * <tex>\chi^2 \leq \chi^2_1</tex> (попадает в левый "хвост" распределения) гипотеза <tex>H_0</tex> отвергается. |
- | <tex>\chi^2 \leq \chi^2_1</tex> (попадает в левый "хвост" распределения) гипотеза <tex>H_0</tex> отвергается. | + | |
- | * | + | * <tex>\chi^2 \geq \chi^2_2</tex> (попадает в правый "хвост" распределения) гипотеза <tex>H_0</tex> отвергается. |
- | <tex>\chi^2 \geq \chi^ | + | |
== Сложная гипотеза == | == Сложная гипотеза == |
Версия 18:23, 8 декабря 2008
|
Статья в настоящий момент дорабатывается. Венжега Андрей 00:08, 14 ноября 2008 (MSK) |
Определение
Критерий - наиболее часто используемый статистический критерий для проверки гипотезы , что наблюдаемая случайная величина подчиняется некому теоретическому закону распределения.
Пусть дана случайная величина X .
Гипотеза : с. в. X подчиняется закону распределения .
Для проверки гипотезы рассмотрим выборку, состоящую из n независимых наблюдений над с.в. X:
.
По выборке построим эмпирическое распределение с.в X. Сравнение эмпирического и теоретического распределения производится с помощью специально подобранной случайной величины — критерия согласия. Рассмотрим критерий согласия Пирсона (критерий ):
Гипотеза : Хn порождается функцией .
Разделим [a,b] на k непересекающихся интервалов ;
Пусть - количество наблюдений в j-м интервале: ;
- вероятность попадания наблюдения в j-ый интервал при выполнении гипотезы ;
Ожидаемое число попаданий в j-ый интервал;
Статистика: - Распределение хи-квадрат с k-1 степенью свободы.
Проверка гипотезы
В зависимости от значения критерия , гипотеза может приниматься, либо отвергаться:
- , гипотеза выполняется.
- (попадает в левый "хвост" распределения) гипотеза отвергается.
- (попадает в правый "хвост" распределения) гипотеза отвергается.