Критерий Неменьи

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Математическая формулировка)
Строка 17: Строка 17:
В качестве critical differebce необходимо взять величину
В качестве critical differebce необходимо взять величину
-
::<tex>CD = q_{\alpha}'\frac{k(k+1)}{6n}</tex>,
+
::<tex>CD = q_{\alpha}'\frac{k(k+1)}{6N}</tex>,
где <tex>\alpha</tex> — необходимый уровень значимости, а <tex>q_{\alpha}'</tex> — значение статистики стьюдентизированного размаха (studentized range statistic)<ref>[http://en.wikipedia.org/wiki/Studentized_range Studentized range]</ref>, деленной на <tex>\sqrt{2}</tex>.
где <tex>\alpha</tex> — необходимый уровень значимости, а <tex>q_{\alpha}'</tex> — значение статистики стьюдентизированного размаха (studentized range statistic)<ref>[http://en.wikipedia.org/wiki/Studentized_range Studentized range]</ref>, деленной на <tex>\sqrt{2}</tex>.

Версия 22:54, 10 января 2014

Критерий Неменьи (также Nemenyi test, Nemenyi-Damico-Wolfe-Dunn test) — статистический критерий, используемый для проверки наличия сдвига между группами в однофакторном непараметрическом дисперсионном анализе.

Критерий предложен Петром Неменьи в 1963 году.[1]

Содержание

Общая идея

Данный критерий основан на ранжировании всей выборки. Если в выборке всего k групп по n наблюдений в каждой, то наименьшему наблюдению присваивается ранг 1, а наибольшему - ранг k*n. Затем для каждой из групп подсчитывается средний ранг и вычисляются абсолютные значения их разностей. По сравнению этих значений с некоторыми пороговыми значениями (critical difference) делается вывод об уровне сходства или различия в группах.

Математическая формулировка

Пусть заданы k выборок одинакового объема n: x_1=\left\{x_{11},\dots,x_{1n}\right\}, \dots, x_k=\left\{x_{k1},\dots,x_{kn}\right\} из неизвестных непрерывных распределений F_1(x),\dots,F_k(x). Объединённая выборка: x=x_1\cup x_2\cup \dots \cup x_k.

Нулевая гипотеза H_0:\; F_1(x)=\dots=F_k(x) при альтернативе H_1:\; F_1(x)=F_2(x-\Delta_1)=\dots=F_k(x-\Delta_{k-1}).

Для применения критерия Неменьи упорядочим все N = n*k элементов объединенной выборки по возрастанию и зададим каждому элементу x_{ij} ранг r_{ij}=\#x_{ij} (если в объединенной выборке присутствуют одинаковые элементы, то им следует задавать одинаковый ранг таким образом, чтобы в сумме их ранги давали число, равное сумме их последовательных номеров при ранжировании). Далее для каждой выборки подсчитаем ее ранг как средний ранг ее элементов: R_i = \frac{1}{n}\sum_{j=1}^n r_{ij}. Статистикой критерия являются абсолютные значения разностей рангов выборок:

D_{l,m} = |R_l-R_m|, \quad l,m\in\{1,\dots,k\}

В качестве critical differebce необходимо взять величину

CD = q_{\alpha}'\frac{k(k+1)}{6N},

где \alpha — необходимый уровень значимости, а q_{\alpha}' — значение статистики стьюдентизированного размаха (studentized range statistic)[1], деленной на \sqrt{2}.

Если D_{lm}>CD, то частная нулевая гипотеза H_0:\;\Delta_l=\Delta_m отклоняется против двусторонней альтернативы.

Пример использования

См. Ермолаев О.Ю. Математическая статистика для психологов. Задача 10.5.

В 4 группах спортсменов высокой квалификации (футболисты, гимнасты, теннисисты и пловцы, по 5 человек в каждой) сравнивались время реакции выбора в мс. Психолог выясняет, будут ли различия во времени реакции у спортсменов разного профиля.

В этой задаче гипотеза H_0 констатирует отсутствие различий между группами, а также отсутствие влияния специализации на время реакции.

Результаты экспериментов приведены в таблице ниже, в которой проведено необходимое ранжирование экспериментальных данных одновременно по всей выборке в целом.

1 группа 2 группа 3 группа 4 группа
Баллы Ранги Баллы Ранги Баллы Ранги Баллы Ранги
203 12 213 16 171 5 207 13
184 7.5 246 18 208 14 152 2
169 4 184 7.5 260 19 176 6
216 17 282 20 193 10 200 11
209 15 190 9 160 3 145 1
Сумма рангов по столбцам 55.5 70.5 51 33

Имеем:

D_{1,2} = 15,
D_{1,3} = 4.5,
D_{1,4} = 22.5,
D_{2,3} = 19.5,
D_{2,4} = 37.5,
D_{3,4} = 18.

Для уровня значимости \alpha = 0.05 critical difference CD = 48.1. В итоге получаем, что различия в скорости реакции спортсменов имеют случайный характер и тип специализации не влияет на эти показатели.

Реализации

Литература

  1. Лапач С.Н. , Чубенко А.В., Бабич П.Н. Статистика в науке и бизнесе. — Киев: Морион, 2002.
  2. Кобзарь А.И. Прикладная математическая статистика. — М.: Физматлит, 2006.
  3. Ермолаев О.Ю. Математическая статистика для психологов. 2 издание. — Москва: Флинта, 2003.
  4. Nathalie Japkowicz, Mohak Shah Evaluating Learning Algorithms: A Classification Perspective. Cambridge University Press, 2011.

Ссылки

См. также

Личные инструменты