Критерий Краскела-Уоллиса
Материал из MachineLearning.
м (→Описание критерия) |
(категория) |
||
Строка 31: | Строка 31: | ||
Гипотеза сдвига отклоняется на уровне значимости <tex>\alpha</tex>, если <tex>H \ge H_{\alpha}</tex>, где <tex>H_{\alpha}</tex> — критическое значение, при <tex>k \le 5</tex> и <tex>n_i \le 8</tex> вычисляемое по таблицам. | Гипотеза сдвига отклоняется на уровне значимости <tex>\alpha</tex>, если <tex>H \ge H_{\alpha}</tex>, где <tex>H_{\alpha}</tex> — критическое значение, при <tex>k \le 5</tex> и <tex>n_i \le 8</tex> вычисляемое по таблицам. | ||
- | При | + | При бо{{подст:ударение}}льших значениях применимы различные аппроксимации. |
=== Аппроксимация Краскела-Уоллиса === | === Аппроксимация Краскела-Уоллиса === | ||
Строка 69: | Строка 69: | ||
*[http://en.wikipedia.org/wiki/Kruskal-Wallis_one-way_analysis_of_variance Wikipedia: Kruskal-Wallis one-way analysis of variance] | *[http://en.wikipedia.org/wiki/Kruskal-Wallis_one-way_analysis_of_variance Wikipedia: Kruskal-Wallis one-way analysis of variance] | ||
*[http://www.ed.sc.edu/seaman/edrm712/materials/KW%20AERA%202006.pdf Expanded Tables of Critical Values for the Kruskal-Wallis H Statistic] | *[http://www.ed.sc.edu/seaman/edrm712/materials/KW%20AERA%202006.pdf Expanded Tables of Critical Values for the Kruskal-Wallis H Statistic] | ||
+ | |||
+ | [[Категория: Прикладная статистика]] |
Версия 10:59, 18 ноября 2008
Критерий Краскела-Уоллиса предназначена для проверки равенства средних нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона-Манна-Уитни. Критерий Краскела-Уоллиса является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения. Известен так же под названиями: критерий Крускала-Уоллиса,H-критерий Краскела-Уоллиса, Kruskal-Wallis one-way analysis of variance, Kruskal-Wallis test.
Содержание |
Примеры задач
Пример 1. Проходит чемпионат мира по футболу. Первая выборка —- опрос болельщиков с вопросом "Каковы шансы на победу сборной России?" до начала чемпионата. Вторая выборка —- после первой игры, третья —- после второго матча и т.д. Значения в выборках — шансы России на победу по десятибальной шкале (1 —- никаких перспектив, 10 —- отвезти в Россию кубок —- дело времени). Требуется проверить, зависят ли результаты опросов от хода чемпионата.
Описание критерия
Заданы k выборок: . Объединённая выборка: .
Дополнительные предположения:
- обе выборки простые, объединённая выборка независима;
- выборки взяты из неизвестных непрерывных распределений .
Проверяется нулевая гипотеза при альтернативе .
Упорядочим все элементов выборок по возрастанию и обозначим ранг j-го элемента i-й выборки в полученном вариационном ряду.
Статистика критерия Краскела-Уоллиса для проверки гипотезы о наличии сдвига в параметрах положения двух сравниваемых выборок имеет вид
где .
Гипотеза сдвига отклоняется на уровне значимости , если , где — критическое значение, при и вычисляемое по таблицам. При бо{{подст:ударение}}льших значениях применимы различные аппроксимации.
Аппроксимация Краскела-Уоллиса
Пусть
Тогда статистика
будет иметь при отсутствии сдвига F-распределение с и степенями свободы. Таким образом, нулевая гипотеза отклоняется с достоверностью , если .
Аппроксимация Имана-Давенпорта
В соответстви с ней нулевая гипотеза сдвига отклоняется с достоверностью , если , где
и — соответственно критические значения статистик Фишера и хи-квадрат с соответствующими степенями свободы.
Это более точная аппроксимация, чем аппроксимация Краскела-Уоллиса. При наличии связанных рангов (т.е. когда совпадают значения величин из разных выборок и им присваиваются одинаковые средние ранги) необходимо использовать модифицированную статистику где — размер j-й группы одинаковых элементов; q — количество групп одинаковых элементов. При справедлива аппроксимация распределения статистики -распределением с f=k-1 степенями свободы, т.е. нулевая гипотеза отклоняется, если .
См. также
Литература
- Kruskal W. H. and Wallis W. A. Use of ranks in one-criterion variance analysis. // Journal of the American Statistical Association. — 1952, 47 №260. — Pp. 583–621.
- Ликеш И., Ляга Й. Основные таблицы математической статистики. — М.: Финансы и статистика, 1985.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 466-468 с.