Критерий Неменьи
Материал из MachineLearning.
Критерий Неменьи (также Nemenyi test, Nemenyi-Damico-Wolfe-Dunn test) — статистический критерий, используемый для проверки наличия сдвига между группами в однофакторном непараметрическом дисперсионном анализе.
Критерий предложен Петром Неменьи в 1963 году.[1]
Содержание |
Общая идея
Данный критерий основан на ранжировании всей выборки. Если в выборке всего k групп по n наблюдений в каждой, то наименьшему наблюдению присваивается ранг 1, а наибольшему - ранг k*n. Затем для каждой из групп подсчитывается средний ранг и вычисляются абсолютные значения их разностей. По сравнению этих значений с некоторыми пороговыми значениями (critical difference) делается вывод об уровне сходства или различия в группах.
Математическая формулировка
Пусть заданы k выборок одинакового объема n: из неизвестных непрерывных распределений . Объединённая выборка: .
Нулевая гипотеза при альтернативе .
Для применения критерия Неменьи упорядочим все элементов объединенной выборки по возрастанию и зададим каждому элементу ранг (если в объединенной выборке присутствуют одинаковые элементы, то им следует задавать одинаковый ранг таким образом, чтобы в сумме их ранги давали число, равное сумме их последовательных номеров при ранжировании). Далее для каждой выборки подсчитаем ее ранг как средний ранг ее элементов: . Статистикой критерия являются абсолютные значения разностей рангов выборок:
В качестве critical differebce необходимо взять величину
- ,
где — необходимый уровень значимости, а — значение статистики стьюдентизированного размаха (studentized range statistic)[1], деленной на .
Если , то частная нулевая гипотеза отклоняется против двусторонней альтернативы.
Пример использования
См. Ермолаев О.Ю. Математическая статистика для психологов. Задача 10.5.
В 4 группах спортсменов высокой квалификации (футболисты, гимнасты, теннисисты и пловцы, по 5 человек в каждой) сравнивались время реакции выбора в мс. Психолог выясняет, будут ли различия во времени реакции у спортсменов разного профиля.
В этой задаче гипотеза констатирует отсутствие различий между группами, а также отсутствие влияния специализации на время реакции.
Результаты экспериментов приведены в таблице ниже, в которой проведено необходимое ранжирование экспериментальных данных одновременно по всей выборке в целом.
1 группа | 2 группа | 3 группа | 4 группа | ||||
---|---|---|---|---|---|---|---|
Баллы | Ранги | Баллы | Ранги | Баллы | Ранги | Баллы | Ранги |
203 | 12 | 213 | 16 | 171 | 5 | 207 | 13 |
184 | 7.5 | 246 | 18 | 208 | 14 | 152 | 2 |
169 | 4 | 184 | 7.5 | 260 | 19 | 176 | 6 |
216 | 17 | 282 | 20 | 193 | 10 | 200 | 11 |
209 | 15 | 190 | 9 | 160 | 3 | 145 | 1 |
Сумма рангов по столбцам | 55.5 | 70.5 | 51 | 33 |
Имеем:
Для уровня значимости critical difference . В итоге получаем, что различия в скорости реакции спортсменов имеют случайный характер и тип специализации не влияет на эти показатели.
Реализации
- В системе Matlab: функция FriedmanTest в
Sparse Representation Toolbox
[1]. - В системе R: функция
oneway_test
в пакетеcoin
[1].
Литература
- Лапач С.Н. , Чубенко А.В., Бабич П.Н. Статистика в науке и бизнесе. — Киев: Морион, 2002.
- Кобзарь А.И. Прикладная математическая статистика. — М.: Физматлит, 2006.
- Ермолаев О.Ю. Математическая статистика для психологов. 2 издание. — Москва: Флинта, 2003.
- Nathalie Japkowicz, Mohak Shah Evaluating Learning Algorithms: A Classification Perspective. Cambridge University Press, 2011.
Ссылки
- Nemenyi test в Wikipedia