Критерий Фридмана
Материал из MachineLearning.
(→Описание критерия) |
м (→Описание критерия) |
||
(1 промежуточная версия не показана) | |||
Строка 1: | Строка 1: | ||
'''Критерий Фридмана''' является непараметрическим критерием, предназначенным для проверки однородности статистических даннных. | '''Критерий Фридмана''' является непараметрическим критерием, предназначенным для проверки однородности статистических даннных. | ||
+ | |||
+ | ==Примеры задач== | ||
+ | Пусть на некотором предприятии k подразделений выполняют одну и ту же работу, но на оборудовании различных производителей. | ||
+ | Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения. | ||
+ | Каждое значение в выборке - это числовая оценка производительности данного рабочего. | ||
+ | Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием других производителей. | ||
+ | |||
+ | Другой пример: предположим, существует k альтернативных агротехнических методов обработки полей. | ||
+ | Для каждого такого метода составим выборку из обработанных им полей. | ||
+ | Значение в выборке равно урожайности данного поля. | ||
+ | Требуется определить, эквивалентны ли эти методы с точки зрения объёма собираемого урожая. | ||
==Описание критерия== | ==Описание критерия== | ||
- | Дано <tex>kn</tex> наблюдений <tex>x_{ij}</tex>, где <tex>1 \le i \le n, 1 \le j \le k | + | Дано <tex>kn</tex> наблюдений <tex>x_{ij}</tex>, где <tex>1 \le i \le n,\; 1 \le j \le k. </tex> |
Через <tex>H_0</tex> обозначим гипотезу о равенстве средних для каждой из <tex>k</tex> групп: | Через <tex>H_0</tex> обозначим гипотезу о равенстве средних для каждой из <tex>k</tex> групп: | ||
- | ::<tex>\bar{ | + | ::<tex>H_0\,:\;\bar{x}_1=\ldots=\bar{x}_k.</tex> |
- | Для каждого <tex>i</tex> | + | Для каждого <tex>i,</tex> где <tex>1 \le i \le n,</tex> упорядочим последовательность <tex>x_{i1}, x_{i2}, \ldots, x_{ik}.</tex> |
- | + | Ранг элемента <tex>x_{ij}</tex> внутри такой последовательности обозначим через <tex>r_{ij}.</tex> | |
- | Ранг элемента <tex>x_{ij}</tex> внутри такой последовательности обозначим через <tex>r_{ij}</tex> | + | Очевидно, <tex>1 \le r_{ij} \le k.</tex> |
- | Очевидно, | + | |
- | + | ||
Статистика критерия имеет вид | Статистика критерия имеет вид | ||
- | ::<tex>S = \frac{12n}{k(k+1)}\sum_{j=1}^k(\frac1n \sum_{i=1}^n r_{ij} - \frac{k+1}2)</tex> | + | ::<tex>S = \frac{12n}{k(k+1)}\sum_{j=1}^k\left(\frac1n \sum_{i=1}^n r_{ij} - \frac{k+1}2\right).</tex> |
- | Гипотеза <tex>H_0</tex> принимается, если <tex>S < S_\alpha(n, k)</tex> | + | Гипотеза <tex>H_0</tex> принимается, если <tex>S < S_\alpha(n, k).</tex> |
Критические значения <tex>S_\alpha(n, k)</tex> находятся при помощи интерполяции табличных данных. | Критические значения <tex>S_\alpha(n, k)</tex> находятся при помощи интерполяции табличных данных. | ||
- | При <tex>n \ge 13, k \ge 20</tex> применима аппроксимация | + | При <tex>n \ge 13,\: k \ge 20</tex> применима аппроксимация |
::<tex>S_\alpha(n, k) = \chi^2_\alpha(k-1)</tex>. | ::<tex>S_\alpha(n, k) = \chi^2_\alpha(k-1)</tex>. | ||
Строка 29: | Строка 38: | ||
[[Категория:Прикладная статистика]] | [[Категория:Прикладная статистика]] | ||
+ | [[Категория:Непараметрические статистические тесты]] |
Текущая версия
Критерий Фридмана является непараметрическим критерием, предназначенным для проверки однородности статистических даннных.
Содержание |
Примеры задач
Пусть на некотором предприятии k подразделений выполняют одну и ту же работу, но на оборудовании различных производителей. Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения. Каждое значение в выборке - это числовая оценка производительности данного рабочего. Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием других производителей.
Другой пример: предположим, существует k альтернативных агротехнических методов обработки полей. Для каждого такого метода составим выборку из обработанных им полей. Значение в выборке равно урожайности данного поля. Требуется определить, эквивалентны ли эти методы с точки зрения объёма собираемого урожая.
Описание критерия
Дано наблюдений , где Через обозначим гипотезу о равенстве средних для каждой из групп:
Для каждого где упорядочим последовательность Ранг элемента внутри такой последовательности обозначим через Очевидно, Статистика критерия имеет вид
Гипотеза принимается, если Критические значения находятся при помощи интерполяции табличных данных.
При применима аппроксимация
- .
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
- Friedman, Milton (December 1937). "The use of ranks to avoid the assumption of normality implicit in the analysis of variance". Journal of the American Statistical Association 32 (200): 675–701.
См. также
Ссылки
- Friedman test(Wikipedia)