Критерии однородности

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: {{Задание|Anton|Vokov|8 января 2010}} '''Критерии однородности''' - это критерии проверки гипотез о том, что две (и...)
(категория, ссылки)
Строка 60: Строка 60:
[[Ранговые критерии]] масштаба для двух выборок:
[[Ранговые критерии]] масштаба для двух выборок:
*[[Критерий Ансари—Бредли]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 492 </ref>
*[[Критерий Ансари—Бредли]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 492 </ref>
-
*[[Критерий Сижела-Тьюки]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 495 </ref>
+
*[[Критерий Зигеля-Тьюки]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 495 </ref>
*[[Критерий Кейпена]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 496 </ref>
*[[Критерий Кейпена]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 496 </ref>
*[[Критерий Клотца]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 499 </ref>
*[[Критерий Клотца]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 499 </ref>
Строка 74: Строка 74:
== Двухвыборочные критерии согласия ==
== Двухвыборочные критерии согласия ==
 +
*[[Критерий Лемана-Розенблатта]]
*[[Двухвыборочный критерий Колмогорова-Смирнова]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 227 </ref>
*[[Двухвыборочный критерий Колмогорова-Смирнова]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 227 </ref>
*[[Критерий Катценбайссера-Хакля]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 228 </ref>
*[[Критерий Катценбайссера-Хакля]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 228 </ref>
Строка 104: Строка 105:
* Модифицированный [[Критерий Стьюдента|критерий Стьюдента]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 397 </ref> позволяет решать задачу в случае равных объемов выборок.
* Модифицированный [[Критерий Стьюдента|критерий Стьюдента]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 397 </ref> позволяет решать задачу в случае равных объемов выборок.
-
* [[Критерий "стьюдентизированного" размаха]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 399 </ref>
+
* [[Критерий стьюдентизированного размаха]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 399 </ref>
* [[Дисперсионный критерий]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 399 </ref>
* [[Дисперсионный критерий]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 399 </ref>
* [[Критерий Полсона]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 402 </ref>
* [[Критерий Полсона]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 402 </ref>
решает задачу отделения выборки с наибольшим средним значением от всех остальных.
решает задачу отделения выборки с наибольшим средним значением от всех остальных.
* [[Критерий Тьюки|Критерий Тьюки (метод прямого сравнения)]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 403 </ref>
* [[Критерий Тьюки|Критерий Тьюки (метод прямого сравнения)]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 403 </ref>
-
* [[Критерий Тьюки|Критерий "стьюдентизированного" максимума (обобщенный критерий Тьюки)]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 405 </ref>
+
* [[Обобщенный критерий Тьюки|Критерий "стьюдентизированного" максимума (обобщенный критерий Тьюки)]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 405 </ref>
* [[Критерий Шеффе]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 406 </ref>
* [[Критерий Шеффе]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 406 </ref>
* [[Критерий Стьюдента-Ньюмена-Кейлса]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 407 </ref>
* [[Критерий Стьюдента-Ньюмена-Кейлса]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 407 </ref>
Строка 121: Строка 122:
*[[Критерий Романовского]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 413 </ref>
*[[Критерий Романовского]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 413 </ref>
*[[Критерий отношения размахов]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 414 </ref>
*[[Критерий отношения размахов]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 414 </ref>
-
*[[Критерий "стьюдентизированного" размаха]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 415 </ref>
+
*[[Критерий стьюдентизированного размаха]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 415 </ref>
*[[Критерий Аризоно-Охты]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 415 </ref>
*[[Критерий Аризоно-Охты]] <ref> ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006, c. 415 </ref>
Строка 164: Строка 165:
* [[Статистика (функция выборки)]]
* [[Статистика (функция выборки)]]
* [[Критерии согласия]]
* [[Критерии согласия]]
 +
 +
[[Категория:Математическая статистика]]
 +
[[Категория:Статистические тесты]]
 +
[[Категория:Прикладная статистика]]

Версия 10:51, 7 января 2010

Данная статья является непроверенным учебным заданием.
Студент: Участник:Anton
Преподаватель: Участник:Vokov
Срок: 8 января 2010

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.


Критерии однородности - это критерии проверки гипотез о том, что две (или более) выборки взяты из одного распределения вероятностей. Рассмотрим такую классификацию критериев:

  1. Непараметрические (свободные от распределения) критерии однородности не предполагают присутствие какой-либо фундаментальной информации о законе распределения. Любое распределение можно описать параметром положения, характеризующим центр группирования случайных величин, и параметром масштаба, характеризующим степень рассеяния случайных величин относительно центра группирования. Когда закон распределения неизвестен, гипотезы о параметрах проверяются при помощи специальных критериев сдвига и масштаба. Также существуют двухвыборочные критерии согласия.
    1. Непараметрические критерии сдвига.
    2. Непараметрические критерии масштаба.
    3. Двухвыборочные критерии согласия.
  2. Если же принимаются какие-либо дополнительные предположения о законе распределения вероятностей, то можно применять

параметрические критерии однородности.

Содержание

Непараметрические критерии однородности

Непараметрические критерии сдвига

Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу. Пусть заданы две выборки x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R},взятые из неизвестных непрерывных распределений F(x) и G(y) соответственно.

Нулевая гипотеза: H_0: \quad F(x) = G(y - \mu)

Наиболее частая альтернативная гипотеза: H_1: \quad F(x) \ne G(y - \mu).

Существует большое количество критериев, проверяющих эту гипотезу:

Ранговые критерии сдвига для двух выборок:

Ранговые критерии сдвига для нескольких (k>2) выборок:

Непараметрические критерии масштаба

Для двух выборок x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}. проверяется гипотеза о том, что они принадлежат одному и тому же распределению, но с разным параметром масштаба. Если плотность распределения первой выборки — f(x), а второй выборки — \frac{1}{\tau}f( \frac{x}{\tau}), то нулевая гипотеза H_0: \quad \tau \ne 1.

Ранговые критерии масштаба для двух выборок:

Ранговые критерии масштаба нескольких (k>2) выборок:

Двухвыборочные критерии согласия

Параметрические критерии однородности

Сравнение параметров нормальных распределений

Сравнение двух средних значений

Имеются две выборки независимых случайных величин  x_1, x_2, \dots, x_n; \qquad y_1, y_2, \dots, y_n. Необходимо на основе выборочных данных установить наличие значимой разницы в средних двух совокупностей, из которых извлечены выборки.

Нулевая гипотеза:  H_0:\quad \mu_1 = \mu_2 .

Альтернативы: H_1:\quad \mu_1 \neq \mu_2; \qquad H_1': \quad \mu_1 > \mu_2; \qquad H_1'':\quad  \mu_1 < \mu_2.

Сравнение нескольких средних значений

Имеются k выборок из нормально распределенной совокупности x_{11},\dots,x_{1n_1}, \dots, x_{k1},\dots,x_{kn_k}.

Нулевая гипотеза H_0: \quad \mu_1=\dots=\mu_k

Альтернатива H_1: \quad |\mu_{i+1} - \mu_0 | > 0 \qquad (i=1,\dots,k).

решает задачу отделения выборки с наибольшим средним значением от всех остальных.

Сравнение двух дисперсий

Для двух нормально распределенных случайных величин x_1, \dots, x_n; \qquad y_1, \dots, y_m необходимо проверить гипотезу равенства дисперсий, опираясь на их выборочные оценки.

Сравнение нескольких дисперсий

Пусть  \sigma_1^2, \dots, \sigma_k^2 - дисперсии выборок

Нулевая гипотеза H_0: \quad \sigma_1^2=\dots=\sigma_k^2

Альтернатива H_1:\quad \sigma_1^2 \neq \sigma_i^2 \qquad (i=2,\dots,k).

Сравнение параметров экспоненциальных распределений

Сравнение двух параметров

Предположим, имеются две выборки из экспоненциальных распределений: x_1, \dots, x_n; \qquad y_1,\dots, y_m, т.е. из распределений с плотностями  f(x) = \frac{1}{\nu_1} \exp{\left( -\frac{x}{\nu_1} \right)}; \qquad g(y) = \frac{1}{\nu_2} \exp{\left( -\frac{y}{\nu_2} \right)}. Здесь \nu_1, \quad \nu_2 - параметры распределений (средние значения). Иногда на практике (задачи анализа надежности объектов) используют параметр  \lambda = \fra{1}{\nu} - интенсивность отказов.

Сравнение нескольких (k>1) параметров

Ссылки


Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
  2. Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003.

См. также

Личные инструменты