Участник:Anton/Песочница

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 44: Строка 44:
Делим лекарства на ценовые коридоры.
Делим лекарства на ценовые коридоры.
-
== Ссылки ==
+
== Сноски ==
<references/>
<references/>
Строка 79: Строка 79:
* [[Проверка статистических гипотез]]
* [[Проверка статистических гипотез]]
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)]]
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)]]
-
 
-
== Ссылки ==
 
-
* [http://www.webpages.uidaho.edu/~brian/stat401ch9_02.pdf Fisher’s least significant difference (LSD)]
 
-
* [http://ru.wikipedia.org/wiki/%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B3%D0%B8%D0%BF%D0%BE%D1%82%D0%B5%D0%B7%D0%B0 Википедия: Проверка статистических гипотез]
 
-
* [http://ru.wikipedia.org/wiki/%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%BA%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9 Википедия: Статистический критерий]
 
-
* [http://www.statsoft.ru/home/textbook/glossary Электронный статистический словарь StatSoft]
 
[[Категория: Прикладная статистика]]
[[Категория: Прикладная статистика]]

Версия 19:11, 4 января 2010

Метод LSD = Метод группирования выборок с наименее значимой разницей = Least Significant Difference method.

Метод LSD позволяет проверять равенство средних значений нескольких выборок. Метод изобретен Фишером в 1935 году [1] и является первым методом множественных сравнений. Также известен как безопасный t-тест (protected t-test method).

Содержание

Описание метода

Пусть имеется k выборок x^{n_1}_1, . . . , x^{n_k}_k объемом n_i (i=1,...,k ) каждая. Через \mu_i обозначим математические ожидания распределений, из которых получены выборки.

Предположим, что

  1. Выборки x^{n_1}_1, . . . , x^{n_k}_k являются нормально-распределенными.
  2. Выборки x^{n_1}_1, . . . , x^{n_k}_k обладают одинаковыми дисперсиями.

Нулевая гипотеза

Метод LSD проверяет нулевую гипотезу H_0 о том, что средние значения всех k выборок одинаковы.

H_0: \mu_1 = \mu_2 =  . . . = \mu_k

Альтернативная гипотеза H_1: существует, по крайней мере, две выборки i и j (i \neq j) с несовпадающими средними значениями.

H_1: \mu_i  \neq \mu_j (для некоторых i \neq j).

Статистика метода LSD

Статистика метода LSD вычисляется в соответствии с соотношением:

T  = \frac{\overline{X}_{i+1} - \overline{X}_{i}}{\sqrt{\frac{n_i + n_{i+1}}{n_i \cdot n_{i+1}} \cdot s^2_{int}}}.

Здесь S^2_{int} - внутригрупповая дисперсия:

S^2_{int}=\frac{1}{n-k}\sum_{i=1}^k\sum_{j=1}^{n_i}\bigl(x_{ij}-\overline{X}_i\bigr)^2


Описание метода

Если по F-критерию нулевая гипотеза о равенстве

Упорядочить средние значения выборок по убыванию.

  1. Для каждой соседней пары начиная с первой выполнить проверки значимости разности средних. Для проверки рассчитывается значение LSD. Для случая одинаково количества наблюдений в каждой выборке используется формула: LSD = t_{n-k, \alpha} \sqrt{\frac{2}{n_i}S_{BH}^2} = \sqrt{\frac{2}{n_i}S_{BH}^2F_{1, n-k, \alpha}}. Это значение используется для проверок всех пар. В ситуации когда объемы выборок различаются, используется формула: LSD_{a,b} = t_{n-k, \alpha} \sqrt{\frac{n_a + n_b}{n_a n_b}S_{BH}^2} = \sqrt{\frac{n_a + n_b}{n_a n_b}S_{BH}^2F_{1, n-k, \alpha}}

Критическая область

Для статистики метода LSD критической областью при уровне значимости \alpha является область

\Omega_{\alpha}:\; T>t_{n-k,\alpha}

где  t_{n-k,\alpha} - квантиль распределения Стьюдента.

Для всех (i, i+1) проверяем гипотезу \overline{X}_{i+1} = \overline{X}_{i}. Если нулевая гипотеза H_0 выполнена, тогда объединяем X_i с X_{i+1}.


Пример использования

 X_i - цены на i-ое лекарство в разных аптеках. Вопрос: какие лекарства взаимозаменяемы по цене? Делим лекарства на ценовые коридоры.

Сноски

  1. S. E. Maxwell, H. D. Delaney Designing experiments and analyzing data: a model comparison perspective. 2003. P. 229.

Литература

  1. Закс Л. Статистическое оценивание. — М.: Статистика, 1976. — 600 с.
  2. Лапач С. Н., Чубенко А. В., Бабич П. Н. Статистические методы в медико-биологических исследованиях с использованием Excel. — Киев: Морион, 2001. — 408 с.
  3. Scott E. Maxwell, Harold D. Delaney Designing experiments and analyzing data: a model comparison perspective. — 2003.
  4. Jason C. Hsu Multiple comparisons: theory and methods. — 1996.

См. также


Данная статья является непроверенным учебным заданием.
Студент: Участник:Anton
Преподаватель: Участник:Vokov
Срок: 15 декабря 2009

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.


Личные инструменты