Критерий Фишера
Материал из MachineLearning.
(→Примеры задач) |
(→Ссылки) |
||
(11 промежуточных версий не показаны.) | |||
Строка 1: | Строка 1: | ||
- | '''Критерий Фишера''' применяется | + | {{TOCright}} |
+ | '''Критерий Фишера''' применяется для проверки равенства [[Дисперсия случайной величины|дисперсий]] двух выборок. | ||
+ | Его относят к ''критериям рассеяния''. | ||
- | + | При проверке гипотезы положения (гипотезы о равенстве средних значений в двух выборках) с использованием [[критерий Стьюдента|критерия Стьюдента]] имеет смысл предварительно проверить гипотезу о равенстве дисперсий. Если она верна, то для сравнения средних можно воспользоваться более [[мощность критерия|мощным]] критерием. | |
- | + | ||
- | + | В [[регрессионный анализ|регрессионном анализе]] критерий Фишера позволяет оценивать значимость линейных регрессионных моделей. | |
+ | В частности, он используется в [[шаговая регрессия|шаговой регрессии]] для проверки целесообразности включения или исключения независимых переменных (признаков) в регрессионную модель. | ||
- | + | В [[Дисперсионный анализ|дисперсионном анализе]] критерий Фишера позволяет оценивать значимость факторов и их взаимодействия. | |
- | + | ||
- | + | Критерий Фишера основан на дополнительных предположениях о независимости и нормальности выборок данных. | |
- | + | Перед его применением рекомендуется выполнить [[Критерии нормальности|проверку нормальности]]. | |
+ | |||
+ | ==Примеры задач== | ||
==Описание критерия== | ==Описание критерия== | ||
Строка 18: | Строка 21: | ||
Обозначим через | Обозначим через | ||
- | <tex>\sigma_1^2</tex> и <tex>\sigma_2^2</tex> [[ | + | <tex>\sigma_1^2</tex> и <tex>\sigma_2^2</tex> [[Дисперсия случайной величины|дисперсии]] выборок <tex>x^n</tex> и <tex>y^m</tex>, <tex>s_1^2</tex> и <tex>s_2^2</tex> — выборочные оценки дисперсий <tex>\sigma_1^2</tex> и <tex>\sigma_2^2</tex>: |
::<tex>s_1^2=\frac{1}{n-1}\sum_{i=1}^n {(x_i-\overline{x})}^2</tex>; | ::<tex>s_1^2=\frac{1}{n-1}\sum_{i=1}^n {(x_i-\overline{x})}^2</tex>; | ||
::<tex>s_2^2=\frac{1}{m-1}\sum_{i=1}^m {(y_i-\overline{y})}^2</tex>, | ::<tex>s_2^2=\frac{1}{m-1}\sum_{i=1}^m {(y_i-\overline{y})}^2</tex>, | ||
Строка 24: | Строка 27: | ||
::<tex>\overline{x}=\frac{1}{n}\sum_{i=1}^n {x_i};\;\; \overline{y}=\frac{1}{m}\sum_{i=1}^m {y_i}</tex> — выборочные средние выборок <tex>x^n</tex> и <tex>y^m</tex>. | ::<tex>\overline{x}=\frac{1}{n}\sum_{i=1}^n {x_i};\;\; \overline{y}=\frac{1}{m}\sum_{i=1}^m {y_i}</tex> — выборочные средние выборок <tex>x^n</tex> и <tex>y^m</tex>. | ||
- | '''Дополнительное предположение''': | + | '''Дополнительное предположение''': выборки <tex>x^n</tex> и <tex>y^m</tex> являются [[Нормальное распределение|нормальными]]. |
+ | Критерий Фишера чувствителен к нарушению предположения о нормальности. | ||
'''[[Нулевая гипотеза]]''' <tex>H_0:\; \sigma_1^2=\sigma_2^2</tex> | '''[[Нулевая гипотеза]]''' <tex>H_0:\; \sigma_1^2=\sigma_2^2</tex> | ||
'''Статистика критерия Фишера''': | '''Статистика критерия Фишера''': | ||
- | |||
::<tex>F=\frac{s_1^2}{s_2^2}</tex> | ::<tex>F=\frac{s_1^2}{s_2^2}</tex> | ||
- | + | имеет [[распределение Фишера]] с <tex>n-1</tex> и <tex>m-1</tex> степенями свободы. | |
- | имеет распределение Фишера с <tex>n-1</tex> и <tex>m-1</tex>. | + | Обычно в числителе ставится большая из двух сравниваемых дисперсий. |
- | + | Тогда [[критическая область критерия|критической областью критерия]] является правый хвост распределения Фишера, | |
- | + | что соотвествует альтернативной гипотезе <tex>H_1'</tex>. | |
- | сравниваемых дисперсий. | + | |
'''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>): | '''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>): | ||
*против альтернативы <tex>H_1:\; \sigma_1^2\neq\sigma_2^2</tex> | *против альтернативы <tex>H_1:\; \sigma_1^2\neq\sigma_2^2</tex> | ||
- | ::если <tex>F | + | ::если <tex>F<F_{\alpha/2}(n-1,m-1)</tex> или <tex>F>F_{1-\alpha/2}(n-1,m-1)</tex>, то нулевая гипотеза <tex>H_0</tex> отвергается в пользу альтернативы <tex>H_1</tex>. |
- | <tex>F | + | |
- | отвергается в пользу альтернативы <tex>H_1</tex> | + | |
*против альтернативы <tex>H_1':\; \sigma_1^2 > \sigma_2^2</tex> | *против альтернативы <tex>H_1':\; \sigma_1^2 > \sigma_2^2</tex> | ||
- | ::если <tex>F>F_{\alpha}(n-1,m-1)</tex>, то нулевая гипотеза <tex>H_0</tex> отвергается | + | ::если <tex>F>F_{1-\alpha}(n-1,m-1)</tex>, то нулевая гипотеза <tex>H_0</tex> отвергается в пользу альтернативы <tex>H_1'</tex>; |
- | в пользу альтернативы <tex>H_1'</tex>; | + | |
где <tex>F_{\alpha}(n-1,m-1)</tex> есть <tex>\alpha</tex>-[[квантиль]] распределения Фишера с <tex>n-1</tex> и <tex>m-1</tex> степенями свободы. | где <tex>F_{\alpha}(n-1,m-1)</tex> есть <tex>\alpha</tex>-[[квантиль]] распределения Фишера с <tex>n-1</tex> и <tex>m-1</tex> степенями свободы. | ||
Строка 54: | Строка 53: | ||
# ''Кобзарь А. И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с. | # ''Кобзарь А. И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с. | ||
- | == | + | == См. также == |
- | * [[Проверка статистических гипотез]] | + | * [[Критерий Стьюдента]] |
+ | * [[Проверка статистических гипотез]] | ||
* [[Статистика (функция выборки)]] | * [[Статистика (функция выборки)]] | ||
- | * [http://ru.wikipedia.org/wiki/Распределение_Фишера Распределение Фишера](Википедия). | + | * [[Нормальный дисперсионный анализ]] |
- | * [http://ru.wikipedia.org/wiki/Критерий_Фишера Критерий Фишера](Википедия). | + | |
+ | == Ссылки == | ||
+ | * [http://ru.wikipedia.org/wiki/Распределение_Фишера Распределение Фишера] (Википедия). | ||
+ | * [http://ru.wikipedia.org/wiki/Критерий_Фишера Критерий Фишера] (Википедия). | ||
+ | * [http://ami.nstu.ru/~headrd/seminar/publik_html/Homogeneity_variance_1.pdf О применении и мощности критериев однородности дисперсий Фишера, Бартлетта, Кокрена, Хартли, Левене на сайте Новосибирского государственного технического университета] | ||
+ | |||
+ | [[Категория:Регрессионный анализ]] | ||
+ | [[Категория:Дисперсионный анализ]] | ||
+ | [[Категория:Параметрические критерии]] | ||
+ | [[Категория:Энциклопедия анализа данных]] | ||
+ | |||
+ | {{Задание|Slimper|Vokov|08 января 2009}} |
Текущая версия
|
Критерий Фишера применяется для проверки равенства дисперсий двух выборок. Его относят к критериям рассеяния.
При проверке гипотезы положения (гипотезы о равенстве средних значений в двух выборках) с использованием критерия Стьюдента имеет смысл предварительно проверить гипотезу о равенстве дисперсий. Если она верна, то для сравнения средних можно воспользоваться более мощным критерием.
В регрессионном анализе критерий Фишера позволяет оценивать значимость линейных регрессионных моделей. В частности, он используется в шаговой регрессии для проверки целесообразности включения или исключения независимых переменных (признаков) в регрессионную модель.
В дисперсионном анализе критерий Фишера позволяет оценивать значимость факторов и их взаимодействия.
Критерий Фишера основан на дополнительных предположениях о независимости и нормальности выборок данных. Перед его применением рекомендуется выполнить проверку нормальности.
Примеры задач
Описание критерия
Заданы две выборки .
Обозначим через и дисперсии выборок и , и — выборочные оценки дисперсий и :
- ;
- ,
где
- — выборочные средние выборок и .
Дополнительное предположение: выборки и являются нормальными. Критерий Фишера чувствителен к нарушению предположения о нормальности.
Статистика критерия Фишера:
имеет распределение Фишера с и степенями свободы. Обычно в числителе ставится большая из двух сравниваемых дисперсий. Тогда критической областью критерия является правый хвост распределения Фишера, что соотвествует альтернативной гипотезе .
Критерий (при уровне значимости ):
- против альтернативы
- если или , то нулевая гипотеза отвергается в пользу альтернативы .
- против альтернативы
- если , то нулевая гипотеза отвергается в пользу альтернативы ;
где есть -квантиль распределения Фишера с и степенями свободы.
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
См. также
- Критерий Стьюдента
- Проверка статистических гипотез
- Статистика (функция выборки)
- Нормальный дисперсионный анализ
Ссылки
- Распределение Фишера (Википедия).
- Критерий Фишера (Википедия).
- О применении и мощности критериев однородности дисперсий Фишера, Бартлетта, Кокрена, Хартли, Левене на сайте Новосибирского государственного технического университета
Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |