Критерий Неменьи
Материал из MachineLearning.
(Новая: '''Критерий Неменьи''' (также ''Nemenyi test'', ''Nemenyi-Damico-Wolfe-Dunn test'') — [[Статистический критерий|статистический ...) |
м |
||
(2 промежуточные версии не показаны) | |||
Строка 5: | Строка 5: | ||
== Общая идея == | == Общая идея == | ||
- | Данный критерий основан на ранжировании всей выборки. Если в выборке всего k групп по n наблюдений в каждой, то наименьшему наблюдению присваивается ранг 1, а наибольшему - ранг k*n. Затем | + | Данный критерий основан на ранжировании всей выборки. Если в выборке всего k групп по n наблюдений в каждой, то наименьшему наблюдению присваивается ранг 1, а наибольшему - ранг k*n. Затем для каждой из групп подсчитывается средний ранг и вычисляются абсолютные значения их разностей. По сравнению этих значений с некоторыми пороговыми значениями (critical difference) делается вывод об уровне сходства или различия в группах. |
== Математическая формулировка == | == Математическая формулировка == | ||
+ | Пусть заданы <i>k</i> выборок одинакового объема n: <tex>x_1=\left\{x_{11},\dots,x_{1n}\right\}, \dots, x_k=\left\{x_{k1},\dots,x_{kn}\right\}</tex> из неизвестных непрерывных распределений <tex>F_1(x),\dots,F_k(x)</tex>. Объединённая выборка: <tex>x=x_1\cup x_2\cup \dots \cup x_k</tex>. | ||
- | + | Нулевая гипотеза <tex>H_0:\; F_1(x)=\dots=F_k(x)</tex> при альтернативе <tex>H_1:\; F_1(x)=F_2(x-\Delta_1)=\dots=F_k(x-\Delta_{k-1})</tex>. | |
- | + | Для применения критерия Неменьи упорядочим все <tex>N = n*k</tex> элементов объединенной выборки по возрастанию и зададим каждому элементу <tex>x_{ij}</tex> ранг <tex>r_{ij}=\#x_{ij}</tex> (если в объединенной выборке присутствуют одинаковые элементы, то им следует задавать одинаковый ранг таким образом, чтобы в сумме их ранги давали число, равное сумме их последовательных номеров при ранжировании). Далее для каждой выборки подсчитаем ее ранг как средний ранг ее элементов: <tex>R_i = \frac{1}{n}\sum_{j=1}^n r_{ij}</tex>. Статистикой критерия являются абсолютные значения разностей рангов выборок: | |
- | ::<tex> | + | ::<tex>D_{l,m} = |R_l-R_m|, \quad l,m\in\{1,\dots,k\}</tex> |
- | + | В качестве critical differebce необходимо взять величину | |
- | ::<tex> \ | + | ::<tex>CD = q_{\alpha}'\frac{k(k+1)}{6N}</tex>, |
- | + | где <tex>\alpha</tex> — необходимый уровень значимости, а <tex>q_{\alpha}'</tex> — значение статистики стьюдентизированного размаха (studentized range statistic)<ref>[http://en.wikipedia.org/wiki/Studentized_range Studentized range]</ref>, деленной на <tex>\sqrt{2}</tex>. | |
- | + | ||
- | + | Если <tex>D_{lm}>CD</tex>, то частная нулевая гипотеза <tex>H_0:\;\Delta_l=\Delta_m</tex> отклоняется против двусторонней альтернативы. | |
- | + | == Пример использования == | |
- | + | ||
- | + | См. Ермолаев О.Ю. Математическая статистика для психологов. Задача 10.5. | |
- | + | В 4 группах спортсменов высокой квалификации (футболисты, гимнасты, теннисисты и пловцы, по 5 человек в каждой) сравнивались время реакции выбора в мс. Психолог выясняет, будут ли различия во времени реакции у спортсменов разного профиля. | |
- | + | В этой задаче гипотеза <tex>H_0</tex> констатирует отсутствие различий между группами, а также отсутствие влияния специализации на время реакции. | |
- | + | ||
- | + | ||
- | + | ||
+ | Результаты экспериментов приведены в таблице ниже, в которой проведено необходимое ранжирование экспериментальных данных одновременно по всей выборке в целом. | ||
+ | |||
+ | {| class="wikitable" | ||
+ | |- | ||
+ | ! colspan="2" | 1 группа | ||
+ | ! colspan="2" | 2 группа | ||
+ | ! colspan="2" | 3 группа | ||
+ | ! colspan="2" | 4 группа | ||
+ | |- | ||
+ | | Баллы | ||
+ | | Ранги | ||
+ | | Баллы | ||
+ | | Ранги | ||
+ | | Баллы | ||
+ | | Ранги | ||
+ | | Баллы | ||
+ | | Ранги | ||
+ | |- | ||
+ | | 203 | ||
+ | | 12 | ||
+ | | 213 | ||
+ | | 16 | ||
+ | | 171 | ||
+ | | 5 | ||
+ | | 207 | ||
+ | | 13 | ||
+ | |- | ||
+ | | 184 | ||
+ | | 7.5 | ||
+ | | 246 | ||
+ | | 18 | ||
+ | | 208 | ||
+ | | 14 | ||
+ | | 152 | ||
+ | | 2 | ||
+ | |- | ||
+ | | 169 | ||
+ | | 4 | ||
+ | | 184 | ||
+ | | 7.5 | ||
+ | | 260 | ||
+ | | 19 | ||
+ | | 176 | ||
+ | | 6 | ||
+ | |- | ||
+ | | 216 | ||
+ | | 17 | ||
+ | | 282 | ||
+ | | 20 | ||
+ | | 193 | ||
+ | | 10 | ||
+ | | 200 | ||
+ | | 11 | ||
+ | |- | ||
+ | | 209 | ||
+ | | 15 | ||
+ | | 190 | ||
+ | | 9 | ||
+ | | 160 | ||
+ | | 3 | ||
+ | | 145 | ||
+ | | 1 | ||
+ | |- | ||
+ | | Сумма рангов по столбцам | ||
+ | | 55.5 | ||
+ | | | ||
+ | | 70.5 | ||
+ | | | ||
+ | | 51 | ||
+ | | | ||
+ | | 33 | ||
+ | |} | ||
+ | |||
+ | Имеем: | ||
+ | ::<tex>D_{1,2} = 15,</tex> | ||
+ | ::<tex>D_{1,3} = 4.5,</tex> | ||
+ | ::<tex>D_{1,4} = 22.5,</tex> | ||
+ | ::<tex>D_{2,3} = 19.5,</tex> | ||
+ | ::<tex>D_{2,4} = 37.5,</tex> | ||
+ | ::<tex>D_{3,4} = 18.</tex> | ||
+ | |||
+ | Для уровня значимости <tex>\alpha = 0.05</tex> critical difference <tex>CD = 48.1</tex>. В итоге получаем, что различия в скорости реакции спортсменов имеют случайный характер и тип специализации не влияет на эти показатели. | ||
== Реализации == | == Реализации == | ||
* В системе [[Matlab]]: функция FriedmanTest в [https://sites.google.com/site/sparsereptool/ <code>Sparse Representation Toolbox</code>] <ref>[https://sites.google.com/site/sparsereptool/ Nemenyi test for MATLAB]</ref>. | * В системе [[Matlab]]: функция FriedmanTest в [https://sites.google.com/site/sparsereptool/ <code>Sparse Representation Toolbox</code>] <ref>[https://sites.google.com/site/sparsereptool/ Nemenyi test for MATLAB]</ref>. | ||
* В системе [[R]]: функция [http://www.inside-r.org/packages/cran/coin/docs/oneway_test <code>oneway_test</code>] в пакете [http://cran.r-project.org/web/packages/coin/index.html <code>coin</code>] <ref>[http://hosho.ees.hokudai.ac.jp/~kubo/Rdoc/library/tseries/html/kpss.test.html Nemenyi test for R]</ref>. | * В системе [[R]]: функция [http://www.inside-r.org/packages/cran/coin/docs/oneway_test <code>oneway_test</code>] в пакете [http://cran.r-project.org/web/packages/coin/index.html <code>coin</code>] <ref>[http://hosho.ees.hokudai.ac.jp/~kubo/Rdoc/library/tseries/html/kpss.test.html Nemenyi test for R]</ref>. | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
== Литература == | == Литература == | ||
Строка 53: | Строка 121: | ||
# ''Кобзарь А.И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. | # ''Кобзарь А.И.'' Прикладная математическая статистика. — М.: Физматлит, 2006. | ||
# ''Ермолаев О.Ю.'' Математическая статистика для психологов. 2 издание. — Москва: Флинта, 2003. | # ''Ермолаев О.Ю.'' Математическая статистика для психологов. 2 издание. — Москва: Флинта, 2003. | ||
+ | # ''Nathalie Japkowicz, Mohak Shah'' Evaluating Learning Algorithms: A Classification Perspective. Cambridge University Press, 2011. | ||
== Ссылки == | == Ссылки == | ||
<references /> | <references /> | ||
- | + | *[http://en.wikipedia.org/wiki/Nemenyi_test Nemenyi test] в Wikipedia | |
== См. также == | == См. также == | ||
Строка 65: | Строка 134: | ||
[[Категория:Прикладная статистика]] | [[Категория:Прикладная статистика]] | ||
+ | [[Категория:Статистические тесты]] | ||
[[Категория:Дисперсионный анализ]] | [[Категория:Дисперсионный анализ]] |
Текущая версия
Критерий Неменьи (также Nemenyi test, Nemenyi-Damico-Wolfe-Dunn test) — статистический критерий, используемый для проверки наличия сдвига между группами в однофакторном непараметрическом дисперсионном анализе.
Критерий предложен Петром Неменьи в 1963 году.[1]
Содержание |
Общая идея
Данный критерий основан на ранжировании всей выборки. Если в выборке всего k групп по n наблюдений в каждой, то наименьшему наблюдению присваивается ранг 1, а наибольшему - ранг k*n. Затем для каждой из групп подсчитывается средний ранг и вычисляются абсолютные значения их разностей. По сравнению этих значений с некоторыми пороговыми значениями (critical difference) делается вывод об уровне сходства или различия в группах.
Математическая формулировка
Пусть заданы k выборок одинакового объема n: из неизвестных непрерывных распределений . Объединённая выборка: .
Нулевая гипотеза при альтернативе .
Для применения критерия Неменьи упорядочим все элементов объединенной выборки по возрастанию и зададим каждому элементу ранг (если в объединенной выборке присутствуют одинаковые элементы, то им следует задавать одинаковый ранг таким образом, чтобы в сумме их ранги давали число, равное сумме их последовательных номеров при ранжировании). Далее для каждой выборки подсчитаем ее ранг как средний ранг ее элементов: . Статистикой критерия являются абсолютные значения разностей рангов выборок:
В качестве critical differebce необходимо взять величину
- ,
где — необходимый уровень значимости, а — значение статистики стьюдентизированного размаха (studentized range statistic)[1], деленной на .
Если , то частная нулевая гипотеза отклоняется против двусторонней альтернативы.
Пример использования
См. Ермолаев О.Ю. Математическая статистика для психологов. Задача 10.5.
В 4 группах спортсменов высокой квалификации (футболисты, гимнасты, теннисисты и пловцы, по 5 человек в каждой) сравнивались время реакции выбора в мс. Психолог выясняет, будут ли различия во времени реакции у спортсменов разного профиля.
В этой задаче гипотеза констатирует отсутствие различий между группами, а также отсутствие влияния специализации на время реакции.
Результаты экспериментов приведены в таблице ниже, в которой проведено необходимое ранжирование экспериментальных данных одновременно по всей выборке в целом.
1 группа | 2 группа | 3 группа | 4 группа | ||||
---|---|---|---|---|---|---|---|
Баллы | Ранги | Баллы | Ранги | Баллы | Ранги | Баллы | Ранги |
203 | 12 | 213 | 16 | 171 | 5 | 207 | 13 |
184 | 7.5 | 246 | 18 | 208 | 14 | 152 | 2 |
169 | 4 | 184 | 7.5 | 260 | 19 | 176 | 6 |
216 | 17 | 282 | 20 | 193 | 10 | 200 | 11 |
209 | 15 | 190 | 9 | 160 | 3 | 145 | 1 |
Сумма рангов по столбцам | 55.5 | 70.5 | 51 | 33 |
Имеем:
Для уровня значимости critical difference . В итоге получаем, что различия в скорости реакции спортсменов имеют случайный характер и тип специализации не влияет на эти показатели.
Реализации
- В системе Matlab: функция FriedmanTest в
Sparse Representation Toolbox
[1]. - В системе R: функция
oneway_test
в пакетеcoin
[1].
Литература
- Лапач С.Н. , Чубенко А.В., Бабич П.Н. Статистика в науке и бизнесе. — Киев: Морион, 2002.
- Кобзарь А.И. Прикладная математическая статистика. — М.: Физматлит, 2006.
- Ермолаев О.Ю. Математическая статистика для психологов. 2 издание. — Москва: Флинта, 2003.
- Nathalie Japkowicz, Mohak Shah Evaluating Learning Algorithms: A Classification Perspective. Cambridge University Press, 2011.
Ссылки
- Nemenyi test в Wikipedia