Метод множественных сравнений Шеффе

Материал из MachineLearning.

Перейти к: навигация, поиск

Метод множественных сравнений Шеффе - это модификация t-критерия Cтьюдента. Это параметрический тест, который выявляет наличие статистически значимых различий между средними для нормально распределенных связных групп на основе дисперсионного анализа. Объемы выборок могут различаться. Нулевая гипотеза предполагает, что выборки бьются на две группы с равными средними. Метод Шеффе использует линейные комбинации средних по выборкам, в то время как метод Тьюки-Крамера рассматривает только попарные сравнения.

Примером использования может послужить следующая задача.

Рассматривался один из методов биотестирования - метод корневого теста. Главный индикационный показатель при этом - длина корня тестобъекта. В качестве тест-объекта был выбран редис. Семена проращивали в рулонной культуре, с трехкратной повторностью, контролировали на дистиллированной воде. Методом множественных сравнений Шеффе подтверждено отличие выживаемости проростков на дистиллированной воде от значений этого показателя в остальных вариантах:Экология: от генов до экосистем (Материалы конференции молодых ученых)

Содержание

Описание критерия

Имеется k выборок x^{n_1}_1, . . . , x^{n_k}_k, объемом n_i\; (i=1,...,k) каждая, где x^{n_i}_i=(x_{i,1},\ldots,x_{i,n_i}),\; x_{i,j}\in\mathbb{R}

Дополнительное предположение

Распределения выборок нормальны.

Нулевая гипотеза

Критерий Шеффе проверяет нулевую гипотезу H_0:\; \sum_{i=1}^{k}c_i\overline{X}_i=0,
где \sum_{i=1}^{k}c_i=0, \overline{X}_i - среднее значение в группе с номером i.

Описание критерия

Алгоритм проверки критерия состоит из следующих шагов

  1. Упорядочить средние значения по возрастанию
  2. Задать c_i,\; i=1,...,k

Пример

Пусть H_0:\; \frac{1}{5}\bigl( \overline{x}_1+\overline{x}_2+\overline{x}_3+\overline{x}_4+\overline{x}_5\bigr)=
\frac{1}{3}\bigl(\overline{x}_6+\overline{x}_7+\overline{x}_8\bigr), тогда c_i=\frac{1}{5},\;i=1\ldots 5 и c_i=-\frac{1}{3},\;i=6..8

Статистика критерия Шеффе

Вводим статистику

S=\frac{\Bigl(\sum_{i=1}^{k}c_i\overline{X}_i\Bigr)^2}{(k-1)S^2_{int}\sum_{i=1}^{k}\frac{c_i^2}{n_i}},

где S^2_{int} - внутригрупповая дисперсия, S^2_{int}=\frac{1}{n-k}\sum_{i=1}^k\sum_{j=1}^{n_i}\bigl(x_{ij}-\overline{X}_i\bigr)^2

Статистика Шеффе имеет распределение Фишера с k-1 и n-k степенями свободы.

Критическая область

Для критерия Шеффе критическая область при уровне значимости \alpha - это область

\Omega_{\alpha}:\; S>F_{k-1,n-k,\alpha}

где F_{k-1,n-k,\alpha} - квантиль Фишера

Примечание

Это односторонний критерий. Он предполагает, что всего 2 различных значения средних. Если это неверно, рекомендуется воспользоваться, например, методом LSD.

Если использовать только попарное сравнение, то в методе Тьюки-Крамера получается несколько точнее результат, но в общем случае предпочтительнее метод Шеффе, т.к. он дает более широкий доверительный интервал.

Критерий Шеффе является грубым критерием и особенно пригоден в тех случаях, когда имеется подозрение о неравенстве дисперсий выборок между собой [1]

Литература


См. также

Ссылки


Статья в настоящий момент дорабатывается.
Елена Корнилина 22:03, 10 января 2009 (MSK)