Участник:Anton/Песочница

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 15: Строка 15:
Если выполнять только шаг 2, то получим ''небезопасный метод LSD (unprotected LSD method)''. Под ''небезопасностью'' понимается неконтролируемое увеличение вероятности ошибок 1-го рода при многократном применении
Если выполнять только шаг 2, то получим ''небезопасный метод LSD (unprotected LSD method)''. Под ''небезопасностью'' понимается неконтролируемое увеличение вероятности ошибок 1-го рода при многократном применении
-
=== Нулевая гипотеза ===
 
-
Метод LSD проверяет '''[[нулевая гипотеза| нулевую гипотезу]] <tex>H_0</tex>''' о том, что средние значения всех <tex>k</tex> выборок одинаковы.
 
-
::<tex>H_0: \mu_1 = \mu_2 = . . . = \mu_k</tex>
 
-
Альтернативная '''гипотеза <tex>H_1</tex>''': существует, по крайней мере, две выборки <tex>i</tex> и <tex>j</tex> (<tex>i \neq j</tex>) с несовпадающими средними значениями.
 
-
::<tex>H_1: \mu_i \neq \mu_j</tex> (для некоторых <tex>i \neq j</tex>).
 
-
=== Статистика метода LSD ===
+
=== Критерий Фишера для проверки гипотезы о равенстве всех средних ===
-
[[Статистика (функция выборки)| Статистика]] метода LSD вычисляется в соответствии с соотношением:
+
-
::<tex>T = \frac{\overline{X}_{i+1} - \overline{X}_{i}}{\sqrt{\frac{n_i + n_{i+1}}{n_i \cdot n_{i+1}} \cdot s^2_{int}}}</tex>.
+
-
Здесь <tex>S^2_{int}</tex> - внутригрупповая дисперсия:
+
-
::<tex>S^2_{int}=\frac{1}{n-k}\sum_{i=1}^k\sum_{j=1}^{n_i}\bigl(x_{ij}-\overline{X}_i\bigr)^2</tex>
+
 +
=== Критерий Стьюдента для проверки гипотезы о равенстве соседних выборок ===
-
=== Описание метода ===
 
-
Если по F-критерию нулевая гипотеза о равенстве
 
-
 
-
Упорядочить средние значения выборок по убыванию.
 
-
#Для каждой соседней пары начиная с первой выполнить проверки значимости разности средних. Для проверки рассчитывается значение LSD. Для случая одинаково количества наблюдений в каждой выборке используется формула: <tex>LSD = t_{n-k, \alpha} \sqrt{\frac{2}{n_i}S_{BH}^2} = \sqrt{\frac{2}{n_i}S_{BH}^2F_{1, n-k, \alpha}}</tex>. Это значение используется для проверок всех пар. В ситуации когда объемы выборок различаются, используется формула: <tex>LSD_{a,b} = t_{n-k, \alpha} \sqrt{\frac{n_a + n_b}{n_a n_b}S_{BH}^2} = \sqrt{\frac{n_a + n_b}{n_a n_b}S_{BH}^2F_{1, n-k, \alpha}}</tex>
 
-
#
 
-
#
 
-
 
-
=== Критическая область ===
 
-
Для статистики метода LSD [[критическая область| критической областью]] при [[Уровень значимости|уровне значимости]] <tex>\alpha</tex> является область
 
-
::<tex>\Omega_{\alpha}:\; T>t_{n-k,\alpha}</tex>
 
-
где <tex> t_{n-k,\alpha}</tex> - [[квантиль]] [[распределение Стьюдента| распределения Стьюдента]].
 
-
 
-
Для всех <tex>(i, i+1)</tex> проверяем гипотезу <tex>\overline{X}_{i+1} = \overline{X}_{i}</tex>. Если нулевая гипотеза <tex>H_0</tex> выполнена, тогда объединяем <tex>X_i</tex> с <tex>X_{i+1}</tex>.
 

Версия 17:00, 5 января 2010

Метод LSD = Метод группирования выборок с наименее значимой разницей = Least Significant Difference method.

Метод LSD позволяет проверять равенство средних значений нескольких выборок и выделять группы выборок с одинаковыми средними значениями. Метод изобретен Фишером в 1935 году [1] и является первым методом множественных сравнений. Также известен как безопасный t-тест (protected t-test method).

Содержание

Описание метода

Обозначения. Пусть имеется k выборок x^{n_1}_1, . . . , x^{n_k}_k объемом n_i (i=1,...,k ) каждая. Через \mu_i обозначим математические ожидания распределений, из которых получены выборки.

Предположим, что

  1. Выборки x^{n_1}_1, . . . , x^{n_k}_k являются нормально-распределенными.
  2. Выборки x^{n_1}_1, . . . , x^{n_k}_k обладают одинаковыми дисперсиями.

Метод состоит из двух этапов:

  1. Сначала при помощи критерия Фишера проверяется гипотеза о равенстве всех \mu_i. Если гипотеза принимается, то метод останавливается, иначе переход к шагу 2.
  2. Выборки упорядочиваются до возрастанию выборочных средних. После этого поэтапно проверяются гипотезы равенства средних соседних выборок помощи критерия Стьюдента. В качестве оценки дисперсии используется внутрегрупповое среднее. Если гипотеза принимается со соответствующие выборки объединяются в одну группу.

Если выполнять только шаг 2, то получим небезопасный метод LSD (unprotected LSD method). Под небезопасностью понимается неконтролируемое увеличение вероятности ошибок 1-го рода при многократном применении

Критерий Фишера для проверки гипотезы о равенстве всех средних

Критерий Стьюдента для проверки гипотезы о равенстве соседних выборок

Пример использования

 X_i - цены на i-ое лекарство в разных аптеках. Вопрос: какие лекарства взаимозаменяемы по цене? Делим лекарства на ценовые коридоры.

Сноски

  1. S. E. Maxwell, H. D. Delaney Designing experiments and analyzing data: a model comparison perspective. 2003. P. 229.

Литература

  1. Закс Л. Статистическое оценивание. — М.: Статистика, 1976. — 600 с.
  2. Лапач С. Н., Чубенко А. В., Бабич П. Н. Статистические методы в медико-биологических исследованиях с использованием Excel. — Киев: Морион, 2001. — 408 с.
  3. Scott E. Maxwell, Harold D. Delaney Designing experiments and analyzing data: a model comparison perspective. — 2003.
  4. Jason C. Hsu Multiple comparisons: theory and methods. — 1996.
  5. Gerald Keller Statistics for Management and Economics: Abbreviated Edition. — 2008.

См. также


Данная статья является непроверенным учебным заданием.
Студент: Участник:Anton
Преподаватель: Участник:Vokov
Срок: 8 января 2009

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.


Личные инструменты