Критерий Фишера

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(категория)
Текущая версия (11:35, 19 октября 2013) (править) (отменить)
(Ссылки)
 
(8 промежуточных версий не показаны.)
Строка 1: Строка 1:
-
'''Критерий Фишера''' применяется для для проверки равенства дисперсий двух выборок.
+
{{TOCright}}
 +
'''Критерий Фишера''' применяется для проверки равенства [[Дисперсия случайной величины|дисперсий]] двух выборок.
 +
Его относят к ''критериям рассеяния''.
-
Критерий Фишера основан на дополнительном предположении о нормальности выборок данных.
+
При проверке гипотезы положения (гипотезы о равенстве средних значений в двух выборках) с использованием [[критерий Стьюдента|критерия Стьюдента]] имеет смысл предварительно проверить гипотезу о равенстве дисперсий. Если она верна, то для сравнения средних можно воспользоваться более [[мощность критерия|мощным]] критерием.
-
Поэтому перед применением критерия рекомендуется выполнить [[Критерии нормальности|проверку нормальности]].
+
-
==Примеры задач==
+
В [[регрессионный анализ|регрессионном анализе]] критерий Фишера позволяет оценивать значимость линейных регрессионных моделей.
 +
В частности, он используется в [[шаговая регрессия|шаговой регрессии]] для проверки целесообразности включения или исключения независимых переменных (признаков) в регрессионную модель.
-
'''Пример 1.'''
+
В [[Дисперсионный анализ|дисперсионном анализе]] критерий Фишера позволяет оценивать значимость факторов и их взаимодействия.
-
Первая выборка - это значения внутривенного давления пациента, перенёсшего операцию. Вторая выборка - некоторые контрольные значения замеров. Значения в выборках - величина внутривенного давления, измеряемого медперсоналом каждые k часов. Требуется определить, является ли динамика изменчивости давления пациента нормой. В случае отсутствия резких отличий в динамике можно считать, что осложнений не предвидится.
+
-
'''Пример 2.'''
+
Критерий Фишера основан на дополнительных предположениях о независимости и нормальности выборок данных.
-
Первая выборка - тигры в зоопарке. Вторая выборка - тигры живущие на воле в некотором заповеднике. Значения в выборках - относительное к количеству женских особей количество детёнышей, появившихся на свет за прошедший год. Требуется выявить насколько содержание в неволе влияет на изменение роста популяции.
+
Перед его применением рекомендуется выполнить [[Критерии нормальности|проверку нормальности]].
 +
 
 +
==Примеры задач==
==Описание критерия==
==Описание критерия==
Строка 18: Строка 21:
Обозначим через
Обозначим через
-
<tex>\sigma_1^2</tex> и <tex>\sigma_2^2</tex> [[дисперсия|дисперсии]] выборок <tex>x^n</tex> и <tex>y^m</tex>, <tex>s_1^2</tex> и <tex>s_2^2</tex> — выборочные оценки дисперсий <tex>\sigma_1^2</tex> и <tex>\sigma_2^2</tex>:
+
<tex>\sigma_1^2</tex> и <tex>\sigma_2^2</tex> [[Дисперсия случайной величины|дисперсии]] выборок <tex>x^n</tex> и <tex>y^m</tex>, <tex>s_1^2</tex> и <tex>s_2^2</tex> — выборочные оценки дисперсий <tex>\sigma_1^2</tex> и <tex>\sigma_2^2</tex>:
::<tex>s_1^2=\frac{1}{n-1}\sum_{i=1}^n {(x_i-\overline{x})}^2</tex>;
::<tex>s_1^2=\frac{1}{n-1}\sum_{i=1}^n {(x_i-\overline{x})}^2</tex>;
::<tex>s_2^2=\frac{1}{m-1}\sum_{i=1}^m {(y_i-\overline{y})}^2</tex>,
::<tex>s_2^2=\frac{1}{m-1}\sum_{i=1}^m {(y_i-\overline{y})}^2</tex>,
Строка 24: Строка 27:
::<tex>\overline{x}=\frac{1}{n}\sum_{i=1}^n {x_i};\;\; \overline{y}=\frac{1}{m}\sum_{i=1}^m {y_i}</tex> — выборочные средние выборок <tex>x^n</tex> и <tex>y^m</tex>.
::<tex>\overline{x}=\frac{1}{n}\sum_{i=1}^n {x_i};\;\; \overline{y}=\frac{1}{m}\sum_{i=1}^m {y_i}</tex> — выборочные средние выборок <tex>x^n</tex> и <tex>y^m</tex>.
-
'''Дополнительное предположение''': выборки <tex>x^n</tex> и <tex>y^m</tex> являются [[нормальная|нормальными]].
+
'''Дополнительное предположение''': выборки <tex>x^n</tex> и <tex>y^m</tex> являются [[Нормальное распределение|нормальными]].
 +
Критерий Фишера чувствителен к нарушению предположения о нормальности.
'''[[Нулевая гипотеза]]''' <tex>H_0:\; \sigma_1^2=\sigma_2^2</tex>
'''[[Нулевая гипотеза]]''' <tex>H_0:\; \sigma_1^2=\sigma_2^2</tex>
'''Статистика критерия Фишера''':
'''Статистика критерия Фишера''':
-
 
::<tex>F=\frac{s_1^2}{s_2^2}</tex>
::<tex>F=\frac{s_1^2}{s_2^2}</tex>
-
 
+
имеет [[распределение Фишера]] с <tex>n-1</tex> и <tex>m-1</tex> степенями свободы.
-
имеет распределение Фишера с <tex>n-1</tex> и <tex>m-1</tex>.
+
Обычно в числителе ставится большая из двух сравниваемых дисперсий.
-
 
+
Тогда [[критическая область критерия|критической областью критерия]] является правый хвост распределения Фишера,
-
В числителе всегда должна стоять большая по величине из двух
+
что соотвествует альтернативной гипотезе <tex>H_1'</tex>.
-
сравниваемых дисперсий.
+
'''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>):
'''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>):
*против альтернативы <tex>H_1:\; \sigma_1^2\neq\sigma_2^2</tex>
*против альтернативы <tex>H_1:\; \sigma_1^2\neq\sigma_2^2</tex>
-
::если <tex>F>F_{\frac{1+\alpha}{2}}(n-1,m-1)</tex> или
+
::если <tex>F<F_{\alpha/2}(n-1,m-1)</tex> или <tex>F>F_{1-\alpha/2}(n-1,m-1)</tex>, то нулевая гипотеза <tex>H_0</tex> отвергается в пользу альтернативы <tex>H_1</tex>.
-
<tex>F<F_{\frac{1-\alpha}{2}}(n-1,m-1)</tex>, то нулевая гипотеза <tex>H_0</tex>
+
-
отвергается в пользу альтернативы <tex>H_1</tex>
+
*против альтернативы <tex>H_1':\; \sigma_1^2 > \sigma_2^2</tex>
*против альтернативы <tex>H_1':\; \sigma_1^2 > \sigma_2^2</tex>
-
::если <tex>F>F_{\alpha}(n-1,m-1)</tex>, то нулевая гипотеза <tex>H_0</tex> отвергается
+
::если <tex>F>F_{1-\alpha}(n-1,m-1)</tex>, то нулевая гипотеза <tex>H_0</tex> отвергается в пользу альтернативы <tex>H_1'</tex>;
-
в пользу альтернативы <tex>H_1'</tex>;
+
где <tex>F_{\alpha}(n-1,m-1)</tex> есть <tex>\alpha</tex>-[[квантиль]] распределения Фишера с <tex>n-1</tex> и <tex>m-1</tex> степенями свободы.
где <tex>F_{\alpha}(n-1,m-1)</tex> есть <tex>\alpha</tex>-[[квантиль]] распределения Фишера с <tex>n-1</tex> и <tex>m-1</tex> степенями свободы.
Строка 54: Строка 53:
# ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006. — 816&nbsp;с.
# ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006. — 816&nbsp;с.
-
== Ссылки ==
+
== См. также ==
-
* [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез.
+
* [[Критерий Стьюдента]]
 +
* [[Проверка статистических гипотез]]
* [[Статистика (функция выборки)]]
* [[Статистика (функция выборки)]]
-
* [http://ru.wikipedia.org/wiki/Распределение_Фишера Распределение Фишера](Википедия).
+
* [[Нормальный дисперсионный анализ]]
-
* [http://ru.wikipedia.org/wiki/Критерий_Фишера Критерий Фишера](Википедия).
+
-
[[Категория:Прикладная статистика]]
+
== Ссылки ==
 +
* [http://ru.wikipedia.org/wiki/Распределение_Фишера Распределение Фишера] (Википедия).
 +
* [http://ru.wikipedia.org/wiki/Критерий_Фишера Критерий Фишера] (Википедия).
 +
* [http://ami.nstu.ru/~headrd/seminar/publik_html/Homogeneity_variance_1.pdf О применении и мощности критериев однородности дисперсий Фишера, Бартлетта, Кокрена, Хартли, Левене на сайте Новосибирского государственного технического университета]
 +
 
 +
[[Категория:Регрессионный анализ]]
 +
[[Категория:Дисперсионный анализ]]
 +
[[Категория:Параметрические критерии]]
[[Категория:Энциклопедия анализа данных]]
[[Категория:Энциклопедия анализа данных]]
 +
 +
{{Задание|Slimper|Vokov|08 января 2009}}

Текущая версия

Содержание

Критерий Фишера применяется для проверки равенства дисперсий двух выборок. Его относят к критериям рассеяния.

При проверке гипотезы положения (гипотезы о равенстве средних значений в двух выборках) с использованием критерия Стьюдента имеет смысл предварительно проверить гипотезу о равенстве дисперсий. Если она верна, то для сравнения средних можно воспользоваться более мощным критерием.

В регрессионном анализе критерий Фишера позволяет оценивать значимость линейных регрессионных моделей. В частности, он используется в шаговой регрессии для проверки целесообразности включения или исключения независимых переменных (признаков) в регрессионную модель.

В дисперсионном анализе критерий Фишера позволяет оценивать значимость факторов и их взаимодействия.

Критерий Фишера основан на дополнительных предположениях о независимости и нормальности выборок данных. Перед его применением рекомендуется выполнить проверку нормальности.

Примеры задач

Описание критерия

Заданы две выборки x^n=(x_1,\ldots,x_n),\; x_i \in \mathbb{R};\;\;
y^m = (y_1,\ldots,y_m),\; y_i \in \mathbb{R}.

Обозначим через \sigma_1^2 и \sigma_2^2 дисперсии выборок x^n и y^m, s_1^2 и s_2^2 — выборочные оценки дисперсий \sigma_1^2 и \sigma_2^2:

s_1^2=\frac{1}{n-1}\sum_{i=1}^n {(x_i-\overline{x})}^2;
s_2^2=\frac{1}{m-1}\sum_{i=1}^m {(y_i-\overline{y})}^2,

где

\overline{x}=\frac{1}{n}\sum_{i=1}^n {x_i};\;\; \overline{y}=\frac{1}{m}\sum_{i=1}^m {y_i} — выборочные средние выборок x^n и y^m.

Дополнительное предположение: выборки x^n и y^m являются нормальными. Критерий Фишера чувствителен к нарушению предположения о нормальности.

Нулевая гипотеза H_0:\; \sigma_1^2=\sigma_2^2

Статистика критерия Фишера:

F=\frac{s_1^2}{s_2^2}

имеет распределение Фишера с n-1 и m-1 степенями свободы. Обычно в числителе ставится большая из двух сравниваемых дисперсий. Тогда критической областью критерия является правый хвост распределения Фишера, что соотвествует альтернативной гипотезе H_1'.

Критерий (при уровне значимости \alpha):

  • против альтернативы H_1:\; \sigma_1^2\neq\sigma_2^2
если F<F_{\alpha/2}(n-1,m-1) или F>F_{1-\alpha/2}(n-1,m-1), то нулевая гипотеза H_0 отвергается в пользу альтернативы H_1.
  • против альтернативы H_1':\; \sigma_1^2 > \sigma_2^2
если F>F_{1-\alpha}(n-1,m-1), то нулевая гипотеза H_0 отвергается в пользу альтернативы H_1';

где F_{\alpha}(n-1,m-1) есть \alpha-квантиль распределения Фишера с n-1 и m-1 степенями свободы.

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.

См. также

Ссылки


Данная статья является непроверенным учебным заданием.
Студент: Участник:Slimper
Преподаватель: Участник:Vokov
Срок: 08 января 2009

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.


Личные инструменты