Метод множественных сравнений Шеффе
Материал из MachineLearning.
(Новая: '''Метод множественных сравнений Шеффе''' выявляет наличие статистически значимых различий между сред...) |
|||
(6 промежуточных версий не показаны.) | |||
Строка 1: | Строка 1: | ||
- | '''Метод множественных сравнений Шеффе''' выявляет наличие статистически значимых различий между средними для нормально распределенных связных групп. Объемы | + | '''Метод множественных сравнений Шеффе''' - это модификация [[Критерий Стьюдента|t-критерия Cтьюдента]]. Это [[Параметрические статистические тесты|параметрический тест]], который выявляет наличие статистически значимых различий между средними для [[Нормальное распределение|нормально распределенных]] [[Связность|связных]] групп на основе [[Дисперсионный анализ|дисперсионного анализа]]. Объемы выборок могут различаться. [[Нулевая гипотеза]] предполагает, что выборки бьются на две группы с равными средними. Метод Шеффе использует линейные комбинации средних по выборкам, в то время как [[Критерий Тьюки-Крамера|метод Тьюки-Крамера]] рассматривает только попарные сравнения. |
+ | ==Примеры задач== | ||
+ | |||
+ | '''Пример 1''' | ||
+ | |||
+ | Компания по производству лакокрасочных изделий разработала новый вид краски | ||
+ | для внешних (уличных) покрытий. Прежде чем выпускать новую продукцию на рынок, | ||
+ | компания намерена проверить устойчивость новой краски к внешним воздействиям. | ||
+ | Компания обладает соответствующим тестирующим оборудованием, которое воздействует | ||
+ | на окрашенную поверхность специальными щетками и фиксирует количество воздействий, | ||
+ | необходимых для полного стирания краски. С помощью этого оборудования были проведены | ||
+ | испытания, в ходе которых сравнивалось качество краски, разработанной компанией, с | ||
+ | аналогичными продуктами, предлагаемыми двумя конкурентами. | ||
+ | |||
+ | Необходимо проверить, различается ли оцениваемое качество продуктов (есть ли статистически | ||
+ | значимое различие в качестве продуктов между компанией и конкурентом: | ||
+ | [http://window.edu.ru/window_catalog/pdf2txt?p_id=26307&p_page=22 Математические основы эмпирических социально-экономических исследований: Учебное пособие] | ||
+ | |||
+ | '''Пример 2''' | ||
+ | |||
+ | Производитель компьютерной и оргтехники разработал новый продукт, | ||
+ | позиционируемый преимущественно на использование в «домашних» условиях, а не в | ||
+ | офисе. Организованы тестовые продажи продукта в магазинах, торгующих бытовой | ||
+ | электроникой, универмагах и специализированных компьютерных магазинах (случайно | ||
+ | отобрано по 5 торговых точек каждой категории). | ||
+ | |||
+ | Необходимо определить, в магазинах какого типа следует организовать основные | ||
+ | продажи (выявить наличие или отсутствие статистически значимого различия между магазинами | ||
+ | электроники и универмагами):[http://window.edu.ru/window_catalog/pdf2txt?p_id=26307&p_page=22 Математические основы эмпирических социально-экономических исследований: Учебное пособие] | ||
+ | |||
+ | '''Пример 3''' | ||
+ | |||
+ | Рассматривался один из методов биотестирования - метод корневого теста. Главный индикационный показатель при этом - длина корня тестобъекта. В качестве тест-объекта был выбран редис. Семена проращивали в рулонной культуре, с трехкратной повторностью, контролировали на дистиллированной воде. Методом множественных сравнений Шеффе подтверждено отличие выживаемости проростков на дистиллированной воде от значений этого показателя в остальных вариантах:[http://ipae.uran.ru/pdf/mk/2005/zhuykova_etal_2005_p96-98.pdf Экология: от генов до экосистем] (Материалы конференции молодых ученых) | ||
== Описание критерия == | == Описание критерия == | ||
- | Имеется <tex>k</tex> выборок <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> объемом <tex>n_i\; (i=1,...,k)</tex> каждая | + | Имеется <tex>k</tex> выборок <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex>, объемом <tex>n_i\; (i=1,...,k)</tex> каждая, где |
+ | <tex>x^{n_i}_i=(x_{i,1},\ldots,x_{i,n_i}),\; x_{i,j}\in\mathbb{R}</tex> | ||
=== Дополнительное предположение === | === Дополнительное предположение === | ||
- | Распределения выборок нормальны | + | Распределения выборок нормальны, выборки [[Связность|связные]]. |
=== Нулевая гипотеза === | === Нулевая гипотеза === | ||
- | Критерий Шеффе проверяет нулевую гипотезу <tex>H_0:\; \sum_{i=1}^{k}c_i\overline{X}_i=0</tex>, | + | Критерий Шеффе проверяет [[Нулевая гипотеза|нулевую гипотезу]] <tex>H_0:\; \sum_{i=1}^{k}c_i\overline{X}_i=0</tex>, |
- | <br/ >где <tex>\sum_{i=1}^{k}c_i=0</tex>, <tex>\overline{X}_i</tex> - среднее значение в группе с номером <tex>i</tex>. | + | <br/ >где <tex>\sum_{i=1}^{k}c_i=0</tex>, <tex>\overline{X}_i</tex> - среднее арифметическое значение в группе с номером <tex>i</tex>. |
=== Описание критерия === | === Описание критерия === | ||
Алгоритм проверки критерия состоит из следующих шагов | Алгоритм проверки критерия состоит из следующих шагов | ||
- | # Упорядочить | + | # Упорядочить выборки по возрастанию средних значений <tex>\overline{X}_i</tex> |
# Задать <tex>c_i,\; i=1,...,k</tex> | # Задать <tex>c_i,\; i=1,...,k</tex> | ||
+ | |||
+ | === Пример === | ||
+ | Пусть <tex>H_0:\; \frac{1}{5}\bigl( \overline{x}_1+\overline{x}_2+\overline{x}_3+\overline{x}_4+\overline{x}_5\bigr)= | ||
+ | \frac{1}{3}\bigl(\overline{x}_6+\overline{x}_7+\overline{x}_8\bigr)</tex> | ||
+ | |||
+ | Т.е. [[Нулевая гипотеза|нулевая гипотеза]] состоит в том, что среднее арифметическое по первым пяти выборкам равно среднему арифметическому последующих трех. | ||
+ | |||
+ | Тогда следует выбрать следующие значения <tex>c_i</tex>: | ||
+ | ::<tex>c_i=\frac{1}{5},\;i=1\ldots 5</tex> и <tex>c_i=-\frac{1}{3},\;i=6..8</tex> | ||
=== Статистика критерия Шеффе === | === Статистика критерия Шеффе === | ||
Строка 22: | Строка 64: | ||
::<tex>S=\frac{\Bigl(\sum_{i=1}^{k}c_i\overline{X}_i\Bigr)^2}{(k-1)S^2_{int}\sum_{i=1}^{k}\frac{c_i^2}{n_i}},</tex> | ::<tex>S=\frac{\Bigl(\sum_{i=1}^{k}c_i\overline{X}_i\Bigr)^2}{(k-1)S^2_{int}\sum_{i=1}^{k}\frac{c_i^2}{n_i}},</tex> | ||
где <tex>S^2_{int}</tex> - внутригрупповая дисперсия, | где <tex>S^2_{int}</tex> - внутригрупповая дисперсия, | ||
- | <tex>S^2_{int}=\frac{1}{n-k}\sum_{i=1}^k\sum_{j=1}^{n_i}\bigl(x_{ij}-\overline{X}_i\bigr)^2</tex> | + | <tex>S^2_{int}=\frac{1}{n-k}\sum_{i=1}^k\sum_{j=1}^{n_i}\bigl(x_{ij}-\overline{X}_i\bigr)^2,\; n=\sum_{i=1}^k{n_i}</tex> |
- | Статистика Шеффе имеет [[ | + | Статистика Шеффе имеет [[Критерий Фишера|распределение Фишера]] с <tex>k-1</tex> и <tex>n-k</tex> степенями свободы. |
=== Критическая область === | === Критическая область === | ||
Строка 30: | Строка 72: | ||
<tex>\alpha</tex> - это область | <tex>\alpha</tex> - это область | ||
::<tex>\Omega_{\alpha}:\; S>F_{k-1,n-k,\alpha}</tex> | ::<tex>\Omega_{\alpha}:\; S>F_{k-1,n-k,\alpha}</tex> | ||
- | где <tex>F_{k-1,n-k,\alpha}</tex> - [[квантиль | + | где <tex>F_{k-1,n-k,\alpha}</tex> - [[Квантиль|квантиль]] Фишера |
=== Примечание === | === Примечание === | ||
Это односторонний критерий. Он предполагает, что всего 2 различных значения средних. | Это односторонний критерий. Он предполагает, что всего 2 различных значения средних. | ||
- | Если это неверно, рекомендуется воспользоваться, например, [[Метод LSD|методом LSD]] | + | Если это неверно, рекомендуется воспользоваться, например, [[Метод LSD|методом LSD]]. |
- | + | ||
- | + | Если использовать только попарное сравнение, то в [[Критерий Тьюки-Крамера|методе Тьюки-Крамера]] результат несколько точнее, но в общем случае предпочтительнее метод Шеффе, т.к. он дает более широкий доверительный интервал. | |
+ | |||
+ | Критерий Шеффе является грубым критерием и особенно пригоден в тех случаях, когда имеется подозрение о неравенстве дисперсий выборок между собой <ref> | ||
+ | {{книга | ||
|автор = Кобзарь А. И. | |автор = Кобзарь А. И. | ||
|заглавие = Прикладная математическая статистика | |заглавие = Прикладная математическая статистика | ||
Строка 43: | Строка 88: | ||
|год = 2006 | |год = 2006 | ||
|страниц = 816 | |страниц = 816 | ||
- | }} | + | }}</ref> |
+ | |||
+ | == Литература == | ||
+ | <references/> | ||
== См. также == | == См. также == | ||
* [[Критерий Фишера]] | * [[Критерий Фишера]] | ||
* [[Метод LSD]] | * [[Метод LSD]] | ||
+ | * [[Критерий Тьюки-Крамера]] | ||
== Ссылки == | == Ссылки == | ||
+ | *[http://en.wikipedia.org/wiki/Multiple_comparisons Multiple comparisons] (Wikipedia) | ||
+ | *[http://en.wikipedia.org/wiki/Scheffe_method Scheffé's method] (Wikipedia) | ||
+ | *[http://www.itl.nist.gov/div898/handbook/prc/section4/prc472.htm Scheffé's method] (Engineering Statistics Handbook) | ||
+ | *[http://en.wikipedia.org/wiki/Tukey-Kramer_method Tukey-Kramer method] (Wikipedia) | ||
+ | |||
+ | |||
+ | [[Категория:Прикладная статистика]] | ||
+ | [[Категория:Дисперсионный анализ]] | ||
- | |||
- | |||
{{stub}} | {{stub}} |
Текущая версия
Метод множественных сравнений Шеффе - это модификация t-критерия Cтьюдента. Это параметрический тест, который выявляет наличие статистически значимых различий между средними для нормально распределенных связных групп на основе дисперсионного анализа. Объемы выборок могут различаться. Нулевая гипотеза предполагает, что выборки бьются на две группы с равными средними. Метод Шеффе использует линейные комбинации средних по выборкам, в то время как метод Тьюки-Крамера рассматривает только попарные сравнения.
Содержание |
Примеры задач
Пример 1
Компания по производству лакокрасочных изделий разработала новый вид краски для внешних (уличных) покрытий. Прежде чем выпускать новую продукцию на рынок, компания намерена проверить устойчивость новой краски к внешним воздействиям. Компания обладает соответствующим тестирующим оборудованием, которое воздействует на окрашенную поверхность специальными щетками и фиксирует количество воздействий, необходимых для полного стирания краски. С помощью этого оборудования были проведены испытания, в ходе которых сравнивалось качество краски, разработанной компанией, с аналогичными продуктами, предлагаемыми двумя конкурентами.
Необходимо проверить, различается ли оцениваемое качество продуктов (есть ли статистически значимое различие в качестве продуктов между компанией и конкурентом: Математические основы эмпирических социально-экономических исследований: Учебное пособие
Пример 2
Производитель компьютерной и оргтехники разработал новый продукт, позиционируемый преимущественно на использование в «домашних» условиях, а не в офисе. Организованы тестовые продажи продукта в магазинах, торгующих бытовой электроникой, универмагах и специализированных компьютерных магазинах (случайно отобрано по 5 торговых точек каждой категории).
Необходимо определить, в магазинах какого типа следует организовать основные продажи (выявить наличие или отсутствие статистически значимого различия между магазинами электроники и универмагами):Математические основы эмпирических социально-экономических исследований: Учебное пособие
Пример 3
Рассматривался один из методов биотестирования - метод корневого теста. Главный индикационный показатель при этом - длина корня тестобъекта. В качестве тест-объекта был выбран редис. Семена проращивали в рулонной культуре, с трехкратной повторностью, контролировали на дистиллированной воде. Методом множественных сравнений Шеффе подтверждено отличие выживаемости проростков на дистиллированной воде от значений этого показателя в остальных вариантах:Экология: от генов до экосистем (Материалы конференции молодых ученых)
Описание критерия
Имеется выборок , объемом каждая, где
Дополнительное предположение
Распределения выборок нормальны, выборки связные.
Нулевая гипотеза
Критерий Шеффе проверяет нулевую гипотезу ,
где , - среднее арифметическое значение в группе с номером .
Описание критерия
Алгоритм проверки критерия состоит из следующих шагов
- Упорядочить выборки по возрастанию средних значений
- Задать
Пример
Пусть
Т.е. нулевая гипотеза состоит в том, что среднее арифметическое по первым пяти выборкам равно среднему арифметическому последующих трех.
Тогда следует выбрать следующие значения :
- и
Статистика критерия Шеффе
Вводим статистику
где - внутригрупповая дисперсия,
Статистика Шеффе имеет распределение Фишера с и степенями свободы.
Критическая область
Для критерия Шеффе критическая область при уровне значимости - это область
где - квантиль Фишера
Примечание
Это односторонний критерий. Он предполагает, что всего 2 различных значения средних. Если это неверно, рекомендуется воспользоваться, например, методом LSD.
Если использовать только попарное сравнение, то в методе Тьюки-Крамера результат несколько точнее, но в общем случае предпочтительнее метод Шеффе, т.к. он дает более широкий доверительный интервал.
Критерий Шеффе является грубым критерием и особенно пригоден в тех случаях, когда имеется подозрение о неравенстве дисперсий выборок между собой [1]
Литература
См. также
Ссылки
- Multiple comparisons (Wikipedia)
- Scheffé's method (Wikipedia)
- Scheffé's method (Engineering Statistics Handbook)
- Tukey-Kramer method (Wikipedia)