Критерий Пейджа
Материал из MachineLearning.
(→Литература) |
|||
(1 промежуточная версия не показана) | |||
Строка 1: | Строка 1: | ||
'''Критерий Пейджа''' является непараметрическим критерием, предназначенным для проверки однородности статистических даннных. | '''Критерий Пейджа''' является непараметрическим критерием, предназначенным для проверки однородности статистических даннных. | ||
+ | |||
+ | ==Примеры задач== | ||
+ | Пусть на некотором предприятии k подразделений выполняют одну и ту же работу, но на оборудовании различных производителей. | ||
+ | Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения. | ||
+ | Каждое значение в выборке - это числовая оценка производительности данного рабочего. | ||
+ | Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием других производителей. | ||
+ | |||
+ | Другой пример: предположим, существует k альтернативных агротехнических методов обработки полей. | ||
+ | Для каждого такого метода составим выборку из обработанных им полей. | ||
+ | Значение в выборке равно урожайности данного поля. | ||
+ | Требуется определить, эквивалентны ли эти методы с точки зрения объёма собираемого урожая. | ||
==Описание критерия== | ==Описание критерия== | ||
Строка 18: | Строка 29: | ||
При <tex>n > 10</tex> распределение <tex>L(n, k)</tex> можно аппроксимировать нормальным: | При <tex>n > 10</tex> распределение <tex>L(n, k)</tex> можно аппроксимировать нормальным: | ||
- | ::<tex>L(n, k) \ | + | ::<tex>L(n, k) \sim N(\frac{nk(k+1)^2}4, \frac{n(k^3-k)^2}{144(k-1)})</tex>. |
==Литература== | ==Литература== | ||
Строка 31: | Строка 42: | ||
[[Категория:Прикладная статистика]] | [[Категория:Прикладная статистика]] | ||
+ | [[Категория:Непараметрические статистические тесты]] |
Текущая версия
Критерий Пейджа является непараметрическим критерием, предназначенным для проверки однородности статистических даннных.
Содержание |
Примеры задач
Пусть на некотором предприятии k подразделений выполняют одну и ту же работу, но на оборудовании различных производителей. Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения. Каждое значение в выборке - это числовая оценка производительности данного рабочего. Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием других производителей.
Другой пример: предположим, существует k альтернативных агротехнических методов обработки полей. Для каждого такого метода составим выборку из обработанных им полей. Значение в выборке равно урожайности данного поля. Требуется определить, эквивалентны ли эти методы с точки зрения объёма собираемого урожая.
Описание критерия
Дано наблюдений , где . Через обозначим гипотезу о равенстве средних для каждой из групп:
- .
Для каждого , где , упорядочим последовательность
- .
Ранг элемента внутри такой последовательности обозначим через . Очевидно,
- .
Статистика критерия имеет вид
- ,
где
- .
Гипотеза принимается, если . Критические значения находятся при помощи интерполяции табличных данных.
При распределение можно аппроксимировать нормальным:
- .
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
- Page E. B. Ordered hypotheses for multiple treatments: A significance test for linear ranks // JASA. 1963. V. 58. P. 216-230.
См. также
Ссылки
- Page's trend test(Wikipedia)