Критерий хи-квадрат
Материал из MachineLearning.
(Различия между версиями)
(Новая: == Определение == Пусть дана случайная величина X . '''Гипотеза <tex> H_0 </tex>''': с. в. X подчиняется закону рас...) |
(→Определение) |
||
Строка 8: | Строка 8: | ||
Для проверки гипотезы рассмотрим выборку, состоящую из n независимых наблюдений над с.в. X: | Для проверки гипотезы рассмотрим выборку, состоящую из n независимых наблюдений над с.в. X: | ||
<tex>X^n = \left( x_1, \cdots \x_n \right), \; x_i \in \left[ a, b \right], \; \forall i=1 \dots n </tex>. | <tex>X^n = \left( x_1, \cdots \x_n \right), \; x_i \in \left[ a, b \right], \; \forall i=1 \dots n </tex>. | ||
- | По выборке построим эмпирическое распределение <tex>F(x) | + | По выборке построим эмпирическое распределение <tex>F^*(x)</tex> с.в X. Сравнение эмпирического <tex>F^*(x)</tex> и теоретического распределения <tex>F(x)</tex> производится с помощью специально подобранной случайной величины — [[Критерий согласия|критерия согласия]]. Рассмотрим критерий согласия Пирсона (критерий <tex>\chi^2</tex>): |
- | '''Гипотеза <tex> H_0^* </tex>''': Х<sup>n</sup> порождается функцией <tex>F(x) | + | '''Гипотеза <tex> H_0^* </tex>''': Х<sup>n</sup> порождается функцией <tex>F^*(x)</tex>. |
Разделим [a,b] на k непересекающихся интервалов <tex> (a_i, b_i], \; i=1 \dots k</tex>; | Разделим [a,b] на k непересекающихся интервалов <tex> (a_i, b_i], \; i=1 \dots k</tex>; | ||
- | Пусть <tex>n_j</tex> - количество наблюдений в j-м интервале: <tex> n_j = \sum_{i=1}^n \left[ a_i <x | + | Пусть <tex>n_j</tex> - количество наблюдений в j-м интервале: <tex> n_j = \sum_{i=1}^n \left[ a_i <x \leq b_i \right] </tex>; |
<tex>p_j = F(b_j)-F(a_j)</tex> - вероятность попадания наблюдения в j-ый интервал при выполнении гипотезы <tex> H_0^* </tex>; | <tex>p_j = F(b_j)-F(a_j)</tex> - вероятность попадания наблюдения в j-ый интервал при выполнении гипотезы <tex> H_0^* </tex>; | ||
Строка 22: | Строка 22: | ||
'''Статистика:''' <tex>\chi_j = \sum_{i=1}^k \frac{ \left( n_j-E_j \right)^2}{E_j} \sim \chi_{k-1}^2</tex> | '''Статистика:''' <tex>\chi_j = \sum_{i=1}^k \frac{ \left( n_j-E_j \right)^2}{E_j} \sim \chi_{k-1}^2</tex> | ||
+ | |||
== Проверка гипотезы == | == Проверка гипотезы == | ||
Версия 21:11, 13 ноября 2008
Содержание |
Определение
Пусть дана случайная величина X .
Гипотеза : с. в. X подчиняется закону распределения .
Для проверки гипотезы рассмотрим выборку, состоящую из n независимых наблюдений над с.в. X:
.
По выборке построим эмпирическое распределение с.в X. Сравнение эмпирического и теоретического распределения производится с помощью специально подобранной случайной величины — критерия согласия. Рассмотрим критерий согласия Пирсона (критерий ):
Гипотеза : Хn порождается функцией .
Разделим [a,b] на k непересекающихся интервалов ;
Пусть - количество наблюдений в j-м интервале: ;
- вероятность попадания наблюдения в j-ый интервал при выполнении гипотезы ;
Ожидаемое число попаданий в j-ый интервал;
Статистика:
Проверка гипотезы
- гипотеза неслучайности
- гипотеза случайности
- гипотеза согласия
Сложная гипотеза
Теорема Фишера
Литература
Ссылки
Статья в настоящий момент дорабатывается. Венжега Андрей 00:08, 14 ноября 2008 (MSK) |