Критерий хи-квадрат

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: == Определение == Пусть дана случайная величина X . '''Гипотеза <tex> H_0 </tex>''': с. в. X подчиняется закону рас...)
(Определение)
Строка 8: Строка 8:
Для проверки гипотезы рассмотрим выборку, состоящую из n независимых наблюдений над с.в. X:
Для проверки гипотезы рассмотрим выборку, состоящую из n независимых наблюдений над с.в. X:
<tex>X^n = \left( x_1, \cdots \x_n \right), \; x_i \in \left[ a, b \right], \; \forall i=1 \dots n </tex>.
<tex>X^n = \left( x_1, \cdots \x_n \right), \; x_i \in \left[ a, b \right], \; \forall i=1 \dots n </tex>.
-
По выборке построим эмпирическое распределение <tex>F(x)^*</tex> с.в X. Сравнение эмпирического <tex>F(x)^*</tex> и теоретического распределения <tex>F(x)</tex> производится с помощью специально подобранной случайной величины — [[Критерий согласия|критерия согласия]]. Рассмотрим критерий согласия Пирсона (критерий <tex>\chi^2</tex>):
+
По выборке построим эмпирическое распределение <tex>F^*(x)</tex> с.в X. Сравнение эмпирического <tex>F^*(x)</tex> и теоретического распределения <tex>F(x)</tex> производится с помощью специально подобранной случайной величины — [[Критерий согласия|критерия согласия]]. Рассмотрим критерий согласия Пирсона (критерий <tex>\chi^2</tex>):
-
'''Гипотеза <tex> H_0^* </tex>''': Х<sup>n</sup> порождается функцией <tex>F(x)^*</tex>.
+
'''Гипотеза <tex> H_0^* </tex>''': Х<sup>n</sup> порождается функцией <tex>F^*(x)</tex>.
Разделим [a,b] на k непересекающихся интервалов <tex> (a_i, b_i], \; i=1 \dots k</tex>;
Разделим [a,b] на k непересекающихся интервалов <tex> (a_i, b_i], \; i=1 \dots k</tex>;
-
Пусть <tex>n_j</tex> - количество наблюдений в j-м интервале: <tex> n_j = \sum_{i=1}^n \left[ a_i <x <b_i \right] </tex>;
+
Пусть <tex>n_j</tex> - количество наблюдений в j-м интервале: <tex> n_j = \sum_{i=1}^n \left[ a_i <x \leq b_i \right] </tex>;
<tex>p_j = F(b_j)-F(a_j)</tex> - вероятность попадания наблюдения в j-ый интервал при выполнении гипотезы <tex> H_0^* </tex>;
<tex>p_j = F(b_j)-F(a_j)</tex> - вероятность попадания наблюдения в j-ый интервал при выполнении гипотезы <tex> H_0^* </tex>;
Строка 22: Строка 22:
'''Статистика:''' <tex>\chi_j = \sum_{i=1}^k \frac{ \left( n_j-E_j \right)^2}{E_j} \sim \chi_{k-1}^2</tex>
'''Статистика:''' <tex>\chi_j = \sum_{i=1}^k \frac{ \left( n_j-E_j \right)^2}{E_j} \sim \chi_{k-1}^2</tex>
 +
== Проверка гипотезы ==
== Проверка гипотезы ==

Версия 21:11, 13 ноября 2008

Содержание

Определение

Пусть дана случайная величина X .

Гипотеза  H_0 : с. в. X подчиняется закону распределения F(x).


Для проверки гипотезы рассмотрим выборку, состоящую из n независимых наблюдений над с.в. X: X^n = \left( x_1, \cdots \x_n \right), \; x_i \in \left[ a, b \right], \; \forall i=1 \dots n . По выборке построим эмпирическое распределение F^*(x) с.в X. Сравнение эмпирического F^*(x) и теоретического распределения F(x) производится с помощью специально подобранной случайной величины — критерия согласия. Рассмотрим критерий согласия Пирсона (критерий \chi^2):


Гипотеза  H_0^* : Хn порождается функцией F^*(x).

Разделим [a,b] на k непересекающихся интервалов  (a_i, b_i], \; i=1 \dots k;

Пусть n_j - количество наблюдений в j-м интервале:  n_j = \sum_{i=1}^n \left[ a_i <x \leq b_i \right] ;

p_j = F(b_j)-F(a_j) - вероятность попадания наблюдения в j-ый интервал при выполнении гипотезы  H_0^* ;

E_j = np_j Ожидаемое число попаданий в j-ый интервал;

Статистика: \chi_j = \sum_{i=1}^k \frac{ \left( n_j-E_j \right)^2}{E_j} \sim \chi_{k-1}^2

Проверка гипотезы

  • гипотеза неслучайности
  • гипотеза случайности
  • гипотеза согласия

Сложная гипотеза

Теорема Фишера

Литература

Ссылки

Статья в настоящий момент дорабатывается.
Венжега Андрей 00:08, 14 ноября 2008 (MSK)


Личные инструменты