Критерий Фишера

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Примеры задач)
(Описание критерия)
Строка 24: Строка 24:
::<tex>\overline{x}=\frac{1}{n}\sum_{i=1}^n {x_i};\;\; \overline{y}=\frac{1}{m}\sum_{i=1}^m {y_i}</tex> — выборочные средние выборок <tex>x^n</tex> и <tex>y^m</tex>.
::<tex>\overline{x}=\frac{1}{n}\sum_{i=1}^n {x_i};\;\; \overline{y}=\frac{1}{m}\sum_{i=1}^m {y_i}</tex> — выборочные средние выборок <tex>x^n</tex> и <tex>y^m</tex>.
-
'''Дополнительное предположение''': выборка [[нормальная]].
+
'''Дополнительное предположение''': выборки <tex>x^n</tex> и <tex>y^m</tex> являются [[нормальная|нормальными]].
'''[[Нулевая гипотеза]]''' <tex>H_0:\; \sigma_1^2=\sigma_2^2</tex>
'''[[Нулевая гипотеза]]''' <tex>H_0:\; \sigma_1^2=\sigma_2^2</tex>

Версия 09:05, 5 ноября 2008

Критерий Фишера применяется для для проверки равенства дисперсий двух выборок.

Критерий Фишера основан на дополнительном предположении о нормальности выборки данных. Поэтому перед применением критерия рекомендуется выполнить проверку нормальности.

Содержание

Примеры задач

Пример 1. Первая выборка - это значения внутривенного давления пациента, перенёсшего операцию. Вторая выборка - некоторые контрольные значения замеров. Значения в выборках - величина внутривенного давления, измеряемого медперсоналом каждые k часов. Требуется определить, является ли динамика изменчивости давления пациента нормой. В случае отсутствия резких отличий в динамике можно считать, что осложнений не предвидится.

Пример 2. Первая выборка - тигры в зоопарке. Вторая выборка - тигры живущие на воле в некотором заповеднике. Значения в выборках - относительное к количеству женских особей количество детёнышей, появившихся на свет за прошедший год. Требуется выявить насколько содержание в неволе влияет на изменение роста популяции.

Описание критерия

Заданы две выборки x^n=(x_1,\ldots,x_n),\; x_i \in \mathbb{R};\;\;
y^m = (y_1,\ldots,y_m),\; y_i \in \mathbb{R}.

Обозначим через \sigma_1^2 и \sigma_2^2 дисперсии выборок x^n и y^m, s_1^2 и s_2^2 — выборочные оценки дисперсий \sigma_1^2 и \sigma_2^2:

s_1^2=\frac{1}{n-1}\sum_{i=1}^n {(x_i-\overline{x})}^2;
s_2^2=\frac{1}{m-1}\sum_{i=1}^m {(y_i-\overline{y})}^2,

где

\overline{x}=\frac{1}{n}\sum_{i=1}^n {x_i};\;\; \overline{y}=\frac{1}{m}\sum_{i=1}^m {y_i} — выборочные средние выборок x^n и y^m.

Дополнительное предположение: выборки x^n и y^m являются нормальными.

Нулевая гипотеза H_0:\; \sigma_1^2=\sigma_2^2

Статистика критерия Фишера:

F=\frac{s_1^2}{s_2^2}

имеет распределение Фишера с n-1 и m-1.

В числителе всегда должна стоять большая по величине из двух сравниваемых дисперсий.

Критерий (при уровне значимости \alpha):

  • против альтернативы H_1:\; \sigma_1^2\neq\sigma_2^2
если F>F_{\frac{1+\alpha}{2}}(n-1,m-1) или

F<F_{\frac{1-\alpha}{2}}(n-1,m-1), то нулевая гипотеза H_0 отвергается в пользу альтернативы H_1

  • против альтернативы H_1':\; \sigma_1^2 > \sigma_2^2
если F>F_{\alpha}(n-1,m-1), то нулевая гипотеза H_0 отвергается

в пользу альтернативы H_1';

где F_{\alpha}(n-1,m-1) есть \alpha-квантиль распределения Фишера с n-1 и m-1 степенями свободы.

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.

Ссылки

Личные инструменты