Метод множественных сравнений Шеффе
Материал из MachineLearning.
Строка 1: | Строка 1: | ||
'''Метод множественных сравнений Шеффе''' - это модификация [[Критерий Стьюдента|t-критерия Cтьюдента]]. Это [[Параметрические статистические тесты|параметрический тест]], который выявляет наличие статистически значимых различий между средними для нормально распределенных связных групп на основе дисперсионного анализа. Объемы выборок могут различаться. [[Нулевая гипотеза]] предполагает, что выборки бьются на две группы с равными средними. Метод Шеффе использует линейные комбинации средних по выборкам, в то время как [[Критерий Тьюки-Крамера|метод Тьюки-Крамера]] рассматривает только попарные сравнения. | '''Метод множественных сравнений Шеффе''' - это модификация [[Критерий Стьюдента|t-критерия Cтьюдента]]. Это [[Параметрические статистические тесты|параметрический тест]], который выявляет наличие статистически значимых различий между средними для нормально распределенных связных групп на основе дисперсионного анализа. Объемы выборок могут различаться. [[Нулевая гипотеза]] предполагает, что выборки бьются на две группы с равными средними. Метод Шеффе использует линейные комбинации средних по выборкам, в то время как [[Критерий Тьюки-Крамера|метод Тьюки-Крамера]] рассматривает только попарные сравнения. | ||
- | + | ==Примеры задач== | |
+ | |||
+ | '''Пример 1''' | ||
+ | |||
+ | Компания по производству лакокрасочных изделий разработала новый вид краски | ||
+ | для внешних (уличных) покрытий. Прежде чем выпускать новую продукцию на рынок, | ||
+ | компания намерена проверить устойчивость новой краски к внешним воздействиям. | ||
+ | Компания обладает соответствующим тестирующим оборудованием, которое воздействует | ||
+ | на окрашенную поверхность специальными щетками и фиксирует количество воздействий, | ||
+ | необходимых для полного стирания краски. С помощью этого оборудования были проведены | ||
+ | испытания, в ходе которых сравнивалось качество краски, разработанной компанией, с | ||
+ | аналогичными продуктами, предлагаемыми двумя конкурентами. | ||
+ | |||
+ | Необходимо проверить, различается ли оцениваемое качество продуктов (есть ли статистически | ||
+ | значимое различие в качестве продуктов между компанией и конкурентом: | ||
+ | [http://window.edu.ru/window_catalog/pdf2txt?p_id=26307&p_page=22 Математические основы эмпирических социально-экономических исследований: Учебное пособие] | ||
+ | |||
+ | '''Пример 2''' | ||
+ | |||
+ | Производитель компьютерной и оргтехники разработал новый продукт, | ||
+ | позиционируемый преимущественно на использование в «домашних» условиях, а не в | ||
+ | офисе. Организованы тестовые продажи продукта в магазинах, торгующих бытовой | ||
+ | электроникой, универмагах и специализированных компьютерных магазинах (случайно | ||
+ | отобрано по 5 торговых точек каждой категории). | ||
+ | |||
+ | Необходимо определить, в магазинах какого типа следует организовать основные | ||
+ | продажи (выявить наличие или отсутствие статистически значимого различия между магазинами | ||
+ | электроники и универмагами):[http://window.edu.ru/window_catalog/pdf2txt?p_id=26307&p_page=22 Математические основы эмпирических социально-экономических исследований: Учебное пособие] | ||
+ | |||
+ | '''Пример 3''' | ||
Рассматривался один из методов биотестирования - метод корневого теста. Главный индикационный показатель при этом - длина корня тестобъекта. В качестве тест-объекта был выбран редис. Семена проращивали в рулонной культуре, с трехкратной повторностью, контролировали на дистиллированной воде. Методом множественных сравнений Шеффе подтверждено отличие выживаемости проростков на дистиллированной воде от значений этого показателя в остальных вариантах:[http://ipae.uran.ru/pdf/mk/2005/zhuykova_etal_2005_p96-98.pdf Экология: от генов до экосистем] (Материалы конференции молодых ученых) | Рассматривался один из методов биотестирования - метод корневого теста. Главный индикационный показатель при этом - длина корня тестобъекта. В качестве тест-объекта был выбран редис. Семена проращивали в рулонной культуре, с трехкратной повторностью, контролировали на дистиллированной воде. Методом множественных сравнений Шеффе подтверждено отличие выживаемости проростков на дистиллированной воде от значений этого показателя в остальных вариантах:[http://ipae.uran.ru/pdf/mk/2005/zhuykova_etal_2005_p96-98.pdf Экология: от генов до экосистем] (Материалы конференции молодых ученых) | ||
+ | |||
== Описание критерия == | == Описание критерия == | ||
Имеется <tex>k</tex> выборок <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex>, объемом <tex>n_i\; (i=1,...,k)</tex> каждая, где | Имеется <tex>k</tex> выборок <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex>, объемом <tex>n_i\; (i=1,...,k)</tex> каждая, где | ||
Строка 12: | Строка 42: | ||
=== Нулевая гипотеза === | === Нулевая гипотеза === | ||
- | Критерий Шеффе проверяет нулевую гипотезу <tex>H_0:\; \sum_{i=1}^{k}c_i\overline{X}_i=0</tex>, | + | Критерий Шеффе проверяет [[Нулевая гипотеза|нулевую гипотезу]] <tex>H_0:\; \sum_{i=1}^{k}c_i\overline{X}_i=0</tex>, |
- | <br/ >где <tex>\sum_{i=1}^{k}c_i=0</tex>, <tex>\overline{X}_i</tex> - среднее значение в группе с номером <tex>i</tex>. | + | <br/ >где <tex>\sum_{i=1}^{k}c_i=0</tex>, <tex>\overline{X}_i</tex> - среднее арифметическое значение в группе с номером <tex>i</tex>. |
=== Описание критерия === | === Описание критерия === | ||
Алгоритм проверки критерия состоит из следующих шагов | Алгоритм проверки критерия состоит из следующих шагов | ||
- | # Упорядочить | + | # Упорядочить выборки по возрастанию средних значений <tex>\overline{X}_i</tex> |
# Задать <tex>c_i,\; i=1,...,k</tex> | # Задать <tex>c_i,\; i=1,...,k</tex> | ||
=== Пример === | === Пример === | ||
Пусть <tex>H_0:\; \frac{1}{5}\bigl( \overline{x}_1+\overline{x}_2+\overline{x}_3+\overline{x}_4+\overline{x}_5\bigr)= | Пусть <tex>H_0:\; \frac{1}{5}\bigl( \overline{x}_1+\overline{x}_2+\overline{x}_3+\overline{x}_4+\overline{x}_5\bigr)= | ||
- | \frac{1}{3}\bigl(\overline{x}_6+\overline{x}_7+\overline{x}_8\bigr),</tex> | + | \frac{1}{3}\bigl(\overline{x}_6+\overline{x}_7+\overline{x}_8\bigr)</tex> |
- | + | ||
+ | Т.е. [[Нулевая гипотеза|нулевая гипотеза]] состоит в том, что среднее арифметическое по первым пяти выборкам равно среднему арифметическому последующих трех. | ||
+ | |||
+ | Тогда следует выбрать следующие значения <tex>c_i</tex>: | ||
+ | ::<tex>c_i=\frac{1}{5},\;i=1\ldots 5</tex> и <tex>c_i=-\frac{1}{3},\;i=6..8</tex> | ||
=== Статистика критерия Шеффе === | === Статистика критерия Шеффе === | ||
Строка 30: | Строка 64: | ||
::<tex>S=\frac{\Bigl(\sum_{i=1}^{k}c_i\overline{X}_i\Bigr)^2}{(k-1)S^2_{int}\sum_{i=1}^{k}\frac{c_i^2}{n_i}},</tex> | ::<tex>S=\frac{\Bigl(\sum_{i=1}^{k}c_i\overline{X}_i\Bigr)^2}{(k-1)S^2_{int}\sum_{i=1}^{k}\frac{c_i^2}{n_i}},</tex> | ||
где <tex>S^2_{int}</tex> - внутригрупповая дисперсия, | где <tex>S^2_{int}</tex> - внутригрупповая дисперсия, | ||
- | <tex>S^2_{int}=\frac{1}{n-k}\sum_{i=1}^k\sum_{j=1}^{n_i}\bigl(x_{ij}-\overline{X}_i\bigr)^2</tex> | + | <tex>S^2_{int}=\frac{1}{n-k}\sum_{i=1}^k\sum_{j=1}^{n_i}\bigl(x_{ij}-\overline{X}_i\bigr)^2,\; n=\sum_{i=1}^k{n_i}</tex> |
- | Статистика Шеффе имеет [[ | + | Статистика Шеффе имеет [[Критерий Фишера|распределение Фишера]] с <tex>k-1</tex> и <tex>n-k</tex> степенями свободы. |
=== Критическая область === | === Критическая область === | ||
Строка 38: | Строка 72: | ||
<tex>\alpha</tex> - это область | <tex>\alpha</tex> - это область | ||
::<tex>\Omega_{\alpha}:\; S>F_{k-1,n-k,\alpha}</tex> | ::<tex>\Omega_{\alpha}:\; S>F_{k-1,n-k,\alpha}</tex> | ||
- | где <tex>F_{k-1,n-k,\alpha}</tex> - [[квантиль | + | где <tex>F_{k-1,n-k,\alpha}</tex> - [[Квантиль|квантиль]] Фишера |
=== Примечание === | === Примечание === | ||
Строка 45: | Строка 79: | ||
Если это неверно, рекомендуется воспользоваться, например, [[Метод LSD|методом LSD]]. | Если это неверно, рекомендуется воспользоваться, например, [[Метод LSD|методом LSD]]. | ||
- | Если использовать только попарное сравнение, то в [[Критерий Тьюки-Крамера|методе Тьюки-Крамера]] | + | Если использовать только попарное сравнение, то в [[Критерий Тьюки-Крамера|методе Тьюки-Крамера]] результат несколько точнее, но в общем случае предпочтительнее метод Шеффе, т.к. он дает более широкий доверительный интервал. |
Критерий Шеффе является грубым критерием и особенно пригоден в тех случаях, когда имеется подозрение о неравенстве дисперсий выборок между собой <ref> | Критерий Шеффе является грубым критерием и особенно пригоден в тех случаях, когда имеется подозрение о неравенстве дисперсий выборок между собой <ref> | ||
Строка 74: | Строка 108: | ||
[[Категория:Дисперсионный анализ]] | [[Категория:Дисперсионный анализ]] | ||
- | |||
{{stub}} | {{stub}} |
Версия 07:47, 11 января 2009
Метод множественных сравнений Шеффе - это модификация t-критерия Cтьюдента. Это параметрический тест, который выявляет наличие статистически значимых различий между средними для нормально распределенных связных групп на основе дисперсионного анализа. Объемы выборок могут различаться. Нулевая гипотеза предполагает, что выборки бьются на две группы с равными средними. Метод Шеффе использует линейные комбинации средних по выборкам, в то время как метод Тьюки-Крамера рассматривает только попарные сравнения.
Содержание |
Примеры задач
Пример 1
Компания по производству лакокрасочных изделий разработала новый вид краски для внешних (уличных) покрытий. Прежде чем выпускать новую продукцию на рынок, компания намерена проверить устойчивость новой краски к внешним воздействиям. Компания обладает соответствующим тестирующим оборудованием, которое воздействует на окрашенную поверхность специальными щетками и фиксирует количество воздействий, необходимых для полного стирания краски. С помощью этого оборудования были проведены испытания, в ходе которых сравнивалось качество краски, разработанной компанией, с аналогичными продуктами, предлагаемыми двумя конкурентами.
Необходимо проверить, различается ли оцениваемое качество продуктов (есть ли статистически значимое различие в качестве продуктов между компанией и конкурентом: Математические основы эмпирических социально-экономических исследований: Учебное пособие
Пример 2
Производитель компьютерной и оргтехники разработал новый продукт, позиционируемый преимущественно на использование в «домашних» условиях, а не в офисе. Организованы тестовые продажи продукта в магазинах, торгующих бытовой электроникой, универмагах и специализированных компьютерных магазинах (случайно отобрано по 5 торговых точек каждой категории).
Необходимо определить, в магазинах какого типа следует организовать основные продажи (выявить наличие или отсутствие статистически значимого различия между магазинами электроники и универмагами):Математические основы эмпирических социально-экономических исследований: Учебное пособие
Пример 3
Рассматривался один из методов биотестирования - метод корневого теста. Главный индикационный показатель при этом - длина корня тестобъекта. В качестве тест-объекта был выбран редис. Семена проращивали в рулонной культуре, с трехкратной повторностью, контролировали на дистиллированной воде. Методом множественных сравнений Шеффе подтверждено отличие выживаемости проростков на дистиллированной воде от значений этого показателя в остальных вариантах:Экология: от генов до экосистем (Материалы конференции молодых ученых)
Описание критерия
Имеется выборок , объемом каждая, где
Дополнительное предположение
Распределения выборок нормальны.
Нулевая гипотеза
Критерий Шеффе проверяет нулевую гипотезу ,
где , - среднее арифметическое значение в группе с номером .
Описание критерия
Алгоритм проверки критерия состоит из следующих шагов
- Упорядочить выборки по возрастанию средних значений
- Задать
Пример
Пусть
Т.е. нулевая гипотеза состоит в том, что среднее арифметическое по первым пяти выборкам равно среднему арифметическому последующих трех.
Тогда следует выбрать следующие значения :
- и
Статистика критерия Шеффе
Вводим статистику
где - внутригрупповая дисперсия,
Статистика Шеффе имеет распределение Фишера с и степенями свободы.
Критическая область
Для критерия Шеффе критическая область при уровне значимости - это область
где - квантиль Фишера
Примечание
Это односторонний критерий. Он предполагает, что всего 2 различных значения средних. Если это неверно, рекомендуется воспользоваться, например, методом LSD.
Если использовать только попарное сравнение, то в методе Тьюки-Крамера результат несколько точнее, но в общем случае предпочтительнее метод Шеффе, т.к. он дает более широкий доверительный интервал.
Критерий Шеффе является грубым критерием и особенно пригоден в тех случаях, когда имеется подозрение о неравенстве дисперсий выборок между собой [1]
Литература
См. также
Ссылки
- Multiple comparisons (Wikipedia)
- Scheffé's method (Wikipedia)
- Scheffé's method (Engineering Statistics Handbook)
- Tukey-Kramer method (Wikipedia)