Критерий Стьюдента

Материал из MachineLearning.

(Различия между версиями)

Текущая версия

Содержание

1 Примеры задач
2 Варианты применения
3 История
4 Литература
5 Ссылки

t-критерий Стьюдента — общее название для статистических тестов, в которых статистика критерия имеет распределение Стьюдента. Наиболее часто t-критерии применяются для проверки равенства средних значений в двух выборках. Нулевая гипотеза предполагает, что средние равны (отрицание этого предположения называют гипотезой сдвига).

Все разновидности критерия Стьюдента являются параметрическими и основаны на дополнительном предположении о нормальности выборки данных. Поэтому перед применением критерия Стьюдента рекомендуется выполнить проверку нормальности. Если гипотеза нормальности отвергается, можно проверить другие распределения, если и они не подходят, то следует воспользоваться непараметрическими статистическими тестами.

Примеры задач

Чаще всего критерий Стьюдента применяется для проверки равенства средних значений в двух выборках.

Пример 1. Первая выборка — это пациенты, которых лечили препаратом А. Вторая выборка — пациенты, которых лечили препаратом Б. Значения в выборках — это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.

Пример 2. Первая выборка — это значения некоторой характеристики состояния пациентов, записанные до лечения. Вторая выборка — это значения той же характеристики состояния тех же пациентов, записанные после лечения. Объёмы обеих выборок обязаны совпадать; более того, порядок элементов (в данном случае пациентов) в выборках также обязан совпадать. Такие выборки называются связными. Требуется выяснить, имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны.

Пример 3. Первая выборка — это поля, обработанные агротехническим методом А. Вторая выборка — поля, обработанные агротехническим методом Б. Значения в выборках — это урожайность. Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.

Пример 4. Первая выборка — это дни, когда в супермаркете проходила промо-акция типа А (красные ценники со скидкой). Вторая выборка — дни промо-акции типа Б (каждая пятая пачка бесплатно). Значения в выборках — это показатель эффективности промо-акции (объём продаж, либо выручка в рублях). Требуется выяснить, какой из типов промо-акции более эффективен.

Варианты применения

Сравнение выборочного среднего с заданным значением

Задана выборка $x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R}$ .

Дополнительное предположение: выборка простая и нормальная.

Нулевая гипотеза $H_0:\; \bar x = \mu$ (выборочное среднее равно заданному числу $\mu$ ).

Статистика критерия:

$\displaystyle t = \frac{(\bar x - \mu)\sqrt{m}}{s}$

имеет распределение Стьюдента с $m-1$ степенями свободы, где

$\displaystyle \bar x = \frac1m \sum_{i=1}^m x_i$ — выборочное среднее,

$\displaystyle s^2 = \frac1{m-1} \sum_{i=1}^m \left( x_i - \bar x \right)^2$ — выборочная дисперсия.

Критерий (при уровне значимости $\alpha$ ):

против альтернативы $H_1:\; \bar x \neq \mu$

если $|t| > t_{\alpha/2}$ , то нулевая гипотеза отвергается;

против альтернативы $H'_1:\; \bar x < \mu$

если $t < t_{\alpha}$ , то нулевая гипотеза отвергается;

против альтернативы $H''_1:\; \bar x > \mu$

если $t > t_{1-\alpha}$ , то нулевая гипотеза отвергается;

где $t_{\alpha}$ есть $\alpha$ -квантиль распределения Стьюдента с $m-1$ степенями свободы.

Сравнение двух выборочных средних при известных дисперсиях

Заданы две выборки $x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}$ .

Дополнительные предположения:

обе выборки простые и нормальные;
значения дисперсий $\sigma^2_x,\, \sigma^2_y$ известны априори; это означает, что дисперсии были оценены заранее не по этим выборкам, а исходя из какой-то другой информации; случай «неизвестных дисперсий», когда такого источника информации нет и дисперсии приходится оценивать по самим выборкам, описан ниже.

Нулевая гипотеза $H_0:\; \bar x = \bar y$ (средние в двух выборках равны).

Статистика критерия:

$z = (\bar x - \bar y) \left( \frac{\sigma^2_x}{m} +\frac{\sigma^2_y}{n} \right)^{-1/2}$

имеет стандартное Нормальное распределение $\mathcal{N}(0,1)$ , где

$\displaystyle \bar x = \frac1m \sum_{i=1}^m x_i,\;\; \bar y = \frac1n \sum_{i=1}^n y_i$ — выборочные средние.

Критерий (при уровне значимости $\alpha$ ):

против альтернативы $H_1:\; \bar x \neq \bar y$

если $|z| > \Phi_{1-\alpha/2}$ , то нулевая гипотеза отвергается;

против альтернативы $H'_1:\; \bar x < \bar y$

если $z < \Phi_{\alpha}$ , то нулевая гипотеза отвергается;

против альтернативы $H''_1:\; \bar x > \bar y$

если $z > \Phi_{1-\alpha}$ , то нулевая гипотеза отвергается;

где $\Phi_{\alpha}$ есть $\alpha$ -квантиль стандартного нормального распределения.

Сравнение двух выборочных средних при неизвестных равных дисперсиях

Заданы две выборки $x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}$ .

Дополнительные предположения:

обе выборки простые и нормальные;
значения дисперсий равны: $\sigma^2_x = \sigma^2_y$ , но априори не известны.

Нулевая гипотеза $H_0:\; \bar x = \bar y$ (средние в двух выборках равны).

Статистика критерия:

$t = \left( \frac{\bar x - \bar y}{s} \right) \sqrt{ \frac{mn}{m+n} }$

имеет распределение Стьюдента с $m+n-2$ степенями свободы, где

$\displaystyle s^2 = \frac{(m-1)s_x^2+(n-1)s_y^2}{m+n-2},\;\; s_x^2 = \frac1{m-1} \sum_{i=1}^m \left( x_i - \bar x \right)^2,\;\; s_y^2 = \frac1{n-1} \sum_{i=1}^n \left( y_i - \bar y \right)^2$ — выборочные дисперсии;

$\displaystyle \bar x = \frac1m \sum_{i=1}^m x_i,\;\; \bar y = \frac1n \sum_{i=1}^n y_i$ — выборочные средние.

Критерий (при уровне значимости $\alpha$ ):

против альтернативы $H_1:\; \bar x \neq \bar y$

если $|z| > t_{\alpha/2}$ , то нулевая гипотеза отвергается;

против альтернативы $H'_1:\; \bar x < \bar y$

если $z < t_{\alpha}$ , то нулевая гипотеза отвергается;

против альтернативы $H''_1:\; \bar x > \bar y$

если $z > t_{1-\alpha}$ , то нулевая гипотеза отвергается;

где $t_{\alpha}$ есть $\alpha$ -квантиль распределения Стьюдента с $m+n-2$ степенями свободы.

Сравнение двух выборочных средних при неизвестных неравных дисперсиях

Задача сравнения средних двух нормально распределённых выборок при неизвестных и неравных дисперсиях известна как проблема Беренса-Фишера. Точного решения этой задачи до настоящего времени нет. На практике используются различные приближения.

Заданы две выборки $x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}$ .

Дополнительное предположение: обе выборки простые и нормальные.

Нулевая гипотеза $H_0:\; \bar x = \bar y$ (средние в двух выборках равны).

Статистика критерия:

$t = \frac{\bar x - \bar y}{s}$

где

$\displaystyle s^2 = \frac1m{s_x^2} + \frac1n{s_y^2},\;\; s_x^2 = \frac1{m-1}\sum_{i=1}^m \left( x_i - \bar x \right)^2,\;\; s_y^2 = \frac1{n-1} \sum_{i=1}^n \left( y_i - \bar y \right)^2$ — выборочные дисперсии;

$\displaystyle \bar x = \frac1m \sum_{i=1}^m x_i,\;\; \bar y = \frac1n \sum_{i=1}^n y_i$ — выборочные средние.

Критерий (при уровне значимости $\alpha$ ):

против альтернативы $H_1:\; \bar x \neq \bar y$

если $t > t'_{\alpha/2}$ , то нулевая гипотеза отвергается;

против альтернативы $H'_1:\; \bar x < \bar y$

если $t < t'_{\alpha}$ , то нулевая гипотеза отвергается;

против альтернативы $H''_1:\; \bar x > \bar y$

если $t > t'_{1-\alpha}$ , то нулевая гипотеза отвергается;

где квантили $t'_{\alpha}$ определяются по-разному в различных приближениях:

Критерий Кохрена-Кокса:

$t'_{\alpha} = \frac{\nu_x t_{\alpha}(m-1) + \nu_y t_{\alpha}(n-1)}{\nu_x+\nu_y},\; \nu_x=\frac{s_x^2}m,\; \nu_y=\frac{s_y^2}n$ , где $t_{\alpha}(f)$ есть $\alpha$ -квантиль распределения Стьюдента с $f$ степенями свободы;

Критерий Сатервайта:

$t'_{\alpha}$ есть $\alpha$ -квантиль распределения Стьюдента с числом степеней свободы $f = s^4\left( \frac1{1-m}\left(\frac{s_x^2}m\right)^2 + \frac1{1-n}\left(\frac{s_y^2}n\right)^2 \right)^{-1}.$

Критерий Крамера-Уэлча:

Сравнение двух выборочных средних в связанных выборках

Заданы две выборки одинаковой длины $x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^m = (y_1,\ldots,y_m),\; y_i \in \mathbb{R}$ .

Дополнительные предположения:

обе выборки простые и нормальные;
выборки связные, то есть элементы $x_i,\: y_i$ соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).

Нулевая гипотеза $H_0:\; \bar x = \bar y$ (средние в двух выборках равны).

Сравнение выборочных средних в связанных выборках ничем не отличается от сравнения среднего разности $d_i = x_i - y_i$ с нулём.

Сравнение разности средних с заданным значением

Заданы две выборки $x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}$ .

Дополнительное предположение:

обе выборки простые и нормальные;
равенство дисперсий может предполагаться либо нет — в зависимости от этого применяется один из критериев, описанных выше.

Нулевая гипотеза $H_0:\; \bar x + A = \bar y$ (средние в двух выборках отличаются на заданную величину).

Модифицированная первая выборка $x'_i = x_i + A$ сравнивается с исходной второй выборкой с помощью одного из критериев, описанных выше.

История

Критерий был разработан Уильямом Госсеттом для оценки качества пива на пивоваренных заводах Гиннесса в Дублине (Ирландия). В связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсетта вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).

Литература

Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.

Ссылки

Проверка статистических гипотез — о методологии проверки статистических гипотез.
Статистика (функция выборки)
Student's t-test (Wikipedia).
t-критерий Стьюдента (Википедия).
Распределение Стьюдента (Википедия).
Квантили распределения Стьюдента (Википедия).

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%9A%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9_%D0%A1%D1%82%D1%8C%D1%8E%D0%B4%D0%B5%D0%BD%D1%82%D0%B0»

Категории: Статистические тесты | Параметрические статистические тесты | Популярные и обзорные статьи

@@ Строка 1: / Строка 1: @@
 {{TOCright}}
-'''t-критерий Стьюдента''' — общее название для [[статистический тест|статистических тестов]], в которых статистика критерия имеет [[распределение Стьюдента]]. Наиболее часто t-критерии применяются для проверки равенства средних значений в двух нормальных [[выборка]]х.
+'''t-критерий Стьюдента''' — общее название для [[статистический тест|статистических тестов]], в которых статистика критерия имеет [[распределение Стьюдента]].
+Наиболее часто t-критерии применяются для проверки равенства средних значений в двух [[выборка]]х.
+[[Нулевая гипотеза]] предполагает, что средние равны (отрицание этого предположения называют [[гипотеза сдвига|гипотезой сдвига]]).
-Все разновидности критерия Стьюдента являются параметрическими и основаны на дополнительном предположении о нормальности выборки данных. Поэтому перед применением критерия Стьюдента рекомендуется выполнить [[Критерии нормальности|проверку нормальности]].
+Все разновидности критерия Стьюдента являются параметрическими и основаны на дополнительном предположении о нормальности выборки данных.
+Поэтому перед применением критерия Стьюдента рекомендуется выполнить [[Критерии нормальности|проверку нормальности]].
+Если гипотеза нормальности отвергается, можно проверить другие распределения, если и они не подходят, то следует воспользоваться [[:Категория:Непараметрические статистические тесты|непараметрическими статистическими тестами]].
-== Сравнение выборочного среднего с заданным значением ==
+== Примеры задач ==
+Чаще всего критерий Стьюдента применяется для проверки равенства средних значений в двух выборках.
+'''Пример 1.'''
+Первая выборка — это пациенты, которых лечили препаратом&nbsp;А.
+Вторая выборка — пациенты, которых лечили препаратом&nbsp;Б.
+Значения в выборках — это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.)
+Требуется выяснить, имеется ли значимое различие эффективности препаратов&nbsp;А&nbsp;и&nbsp;Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.
+'''Пример 2.'''
+Первая выборка — это значения некоторой характеристики состояния пациентов, записанные ''до'' лечения.
+Вторая выборка — это значения ''той же'' характеристики состояния ''тех же'' пациентов, записанные ''после'' лечения.
+Объёмы обеих выборок обязаны совпадать; более того, порядок элементов (в данном случае пациентов) в выборках также обязан совпадать.
+Такие выборки называются ''связными''.
+Требуется выяснить, имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны.
+'''Пример 3.'''
+Первая выборка — это поля, обработанные агротехническим методом&nbsp;А.
+Вторая выборка — поля, обработанные агротехническим методом&nbsp;Б.
+Значения в выборках — это урожайность.
+Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.
+'''Пример 4.'''
+Первая выборка — это дни, когда в супермаркете проходила промо-акция типа&nbsp;А (красные ценники со скидкой).
+Вторая выборка — дни промо-акции типа&nbsp;Б (каждая пятая пачка бесплатно).
+Значения в выборках — это показатель эффективности промо-акции (объём продаж, либо выручка в рублях).
+Требуется выяснить, какой из типов промо-акции более эффективен.
+== Варианты применения ==
+=== Сравнение выборочного среднего с заданным значением ===
 Задана выборка <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R}</tex>.
-'''Дополнительное предположение:''' выборка нормальна.
+'''Дополнительное предположение:'''
+выборка [[простая выборка|простая]] и [[Нормальное распределение|нормальная]].
 '''Нулевая гипотеза''' <tex>H_0:\; \bar x = \mu</tex> (выборочное среднее равно заданному числу <tex>\mu</tex>).
@@ Строка 33: / Строка 69: @@
 <tex> t_{\alpha} </tex> есть <tex>\alpha</tex>-[[квантиль]] распределения Стьюдента с <tex>m-1</tex> степенями свободы.
-== Сравнение двух выборочных средних при известных дисперсиях ==
+=== Сравнение двух выборочных средних при известных дисперсиях ===
 Заданы две выборки <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>.
 '''Дополнительные предположения:'''
-* обе выборки нормальны;
+* обе выборки [[простая выборка|простые]] и [[Нормальное распределение|нормальные]];
 * значения дисперсий <tex> \sigma^2_x,\, \sigma^2_y </tex> известны априори; это означает, что дисперсии были оценены заранее не по этим выборкам, а исходя из какой-то другой информации; случай «неизвестных дисперсий», когда такого источника информации нет и дисперсии приходится оценивать по самим выборкам, [[#Сравнение двух выборочных средних при неизвестных неравных дисперсиях|описан ниже]].
@@ Строка 45: / Строка 81: @@
 '''Статистика критерия:'''
 ::<tex>z = (\bar x - \bar y) \left( \frac{\sigma^2_x}{m} +\frac{\sigma^2_y}{n} \right)^{-1/2}</tex>
-имеет стандартное [[нормальное распределение]] <tex>\mathcal{N}(0,1)</tex>,
+имеет стандартное [[Нормальное распределение]] <tex>\mathcal{N}(0,1)</tex>,
 где
 ::<tex>\displaystyle \bar x = \frac1m \sum_{i=1}^m x_i,\;\; \bar y = \frac1n \sum_{i=1}^n y_i</tex> — выборочные средние.
@@ Строка 52: / Строка 88: @@
 * против альтернативы <tex>H_1:\; \bar x \neq \bar y</tex>
-::если <tex> |z| > \Phi_{\alpha/2} </tex>, то нулевая гипотеза отвергается;
+::если <tex> |z| > \Phi_{1-\alpha/2} </tex>, то нулевая гипотеза отвергается;
 * против альтернативы <tex>H'_1:\; \bar x < \bar y</tex>
@@ Строка 62: / Строка 98: @@
 <tex> \Phi_{\alpha} </tex> есть <tex>\alpha</tex>-[[квантиль]] стандартного нормального распределения.
-== Сравнение двух выборочных средних при неизвестных равных дисперсиях ==
+=== Сравнение двух выборочных средних при неизвестных равных дисперсиях ===
 Заданы две выборки <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>.
 '''Дополнительные предположения:'''
-* обе выборки нормальны;
+* обе выборки [[простая выборка|простые]] и [[Нормальное распределение|нормальные]];
 * значения дисперсий равны: <tex> \sigma^2_x = \sigma^2_y </tex>, но априори не известны.
@@ Строка 76: / Строка 112: @@
 имеет [[распределение Стьюдента]] с  <tex>m+n-2</tex> степенями свободы,
 где
-::<tex>\displaystyle s_x^2  = \frac1{m-1} \sum_{i=1}^m \left( x_i - \bar x \right)^2,\;\; s_y^2  = \frac1{n-1} \sum_{i=1}^n \left( y_i - \bar y \right)^2</tex> — выборочные дисперсии;
+::<tex>\displaystyle s^2  = \frac{(m-1)s_x^2+(n-1)s_y^2}{m+n-2},\;\; s_x^2  = \frac1{m-1} \sum_{i=1}^m \left( x_i - \bar x \right)^2,\;\; s_y^2  = \frac1{n-1} \sum_{i=1}^n \left( y_i - \bar y \right)^2 </tex> — выборочные дисперсии;
-::<tex>\displaystyle s^2  = \frac{(m-1)s_x^2+(n-1)s_y^2}{m+n-2}</tex>;
 ::<tex>\displaystyle \bar x = \frac1m \sum_{i=1}^m x_i,\;\; \bar y = \frac1n \sum_{i=1}^n y_i</tex> — выборочные средние.
@@ Строка 93: / Строка 128: @@
 <tex> t_{\alpha} </tex> есть <tex>\alpha</tex>-[[квантиль]] распределения Стьюдента с <tex>m+n-2</tex> степенями свободы.
-== Сравнение двух выборочных средних при неизвестных неравных дисперсиях ==
+=== Сравнение двух выборочных средних при неизвестных неравных дисперсиях ===
-Задача сравнения средних двух нормально распределённых выборок при неизвестных и неравных дисперсиях известна как проблема Беренса-Фишера. Точного решения этой задачи до настоящего времени нет.  На практике используются различные приближения.
+Задача сравнения средних двух нормально распределённых выборок при неизвестных и неравных дисперсиях известна как проблема Беренса-Фишера.
+Точного решения этой задачи до настоящего времени нет.
+На практике используются различные приближения.
 Заданы две выборки <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>.
-'''Дополнительное предположение:''' обе выборки нормальны.
+'''Дополнительное предположение:'''
+обе выборки [[простая выборка|простые]] и [[Нормальное распределение|нормальные]].
 '''Нулевая гипотеза''' <tex>H_0:\; \bar x = \bar y</tex> (средние в двух выборках равны).
@@ Строка 105: / Строка 143: @@
 ::<tex>t = \frac{\bar x - \bar y}{s}</tex>
 где
-::<tex>\displaystyle s_x^2 = \sum_{i=1}^m \left( x_i - \bar x \right)^2,\;\; s_y^2  = \frac1{n-1} \sum_{i=1}^n \left( y_i - \bar y \right)^2</tex> — выборочные дисперсии;
+::<tex>\displaystyle s^2  = \frac1m{s_x^2}  + \frac1n{s_y^2},\;\; s_x^2 = \frac1{m-1}\sum_{i=1}^m \left( x_i - \bar x \right)^2,\;\; s_y^2  = \frac1{n-1} \sum_{i=1}^n \left( y_i - \bar y \right)^2 </tex> — выборочные дисперсии;
-::<tex>\displaystyle s^2  = \frac1m s_x^2 + \frac1n s_y^2</tex>;
 ::<tex>\displaystyle \bar x = \frac1m \sum_{i=1}^m x_i,\;\; \bar y = \frac1n \sum_{i=1}^n y_i</tex> — выборочные средние.
@@ Строка 119: / Строка 156: @@
 * против альтернативы <tex>H''_1:\; \bar x > \bar y</tex>
 ::если <tex> t > t'_{1-\alpha} </tex>, то нулевая гипотеза отвергается;
-где
+где квантили <tex> t'_{\alpha} </tex> определяются по-разному в различных приближениях:
-::<tex> t'_{\alpha} = \frac{\nu_x t_{\alpha}(m-1) + \nu_y t_{\alpha}(n-1)}{\nu_x+\nu_y},\; \nu_x=\frac{s_x^2}m,\; \nu_y=\frac{s_y^2}n  </tex>;
+:* Критерий Кохрена-Кокса:
-::<tex> t_{\alpha}(f) </tex> есть <tex>\alpha</tex>-[[квантиль]] распределения Стьюдента с <tex>f</tex> степенями свободы.
+::<tex> t'_{\alpha} = \frac{\nu_x t_{\alpha}(m-1) + \nu_y t_{\alpha}(n-1)}{\nu_x+\nu_y},\; \nu_x=\frac{s_x^2}m,\; \nu_y=\frac{s_y^2}n  </tex>, где <tex> t_{\alpha}(f) </tex> есть <tex>\alpha</tex>-[[квантиль]] распределения Стьюдента с <tex>f</tex> степенями свободы;
+:* Критерий Сатервайта:
+::<tex> t'_{\alpha}</tex> есть <tex>\alpha</tex>-[[квантиль]] распределения Стьюдента с числом степеней свободы <tex>f = s^4\left( \frac1{1-m}\left(\frac{s_x^2}m\right)^2  + \frac1{1-n}\left(\frac{s_y^2}n\right)^2 \right)^{-1}.</tex>
+:* Критерий Крамера-Уэлча:
+::<tex> t'_{\alpha}</tex> есть <tex>\alpha</tex>-[[квантиль]] распределения Стьюдента с числом степеней свободы <tex>f = s^4\left( \frac1{1-m}\left(\frac{s_x^2}m\right)^2  + \frac1{1-n}\left(\frac{s_y^2}n\right)^2 \right)^{-1} - 2.</tex>
-== Сравнение двух выборочных средних в связанных выборках ==
+=== Сравнение двух выборочных средних в связанных выборках ===
+Заданы две выборки одинаковой длины <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^m = (y_1,\ldots,y_m),\; y_i \in \mathbb{R}</tex>.
+'''Дополнительные предположения:'''
+* обе выборки [[простая выборка|простые]] и [[Нормальное распределение|нормальные]];
+* выборки связные, то есть элементы <tex>x_i,\: y_i</tex> соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).
+'''Нулевая гипотеза''' <tex>H_0:\; \bar x = \bar y</tex> (средние в двух выборках равны).
+Сравнение выборочных средних в связанных выборках ничем не отличается от сравнения среднего разности <tex>d_i = x_i - y_i</tex> с нулём.
+=== Сравнение разности средних с заданным значением ===
+Заданы две выборки <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>.
+'''Дополнительное предположение:'''
+* обе выборки [[простая выборка|простые]] и [[Нормальное распределение|нормальные]];
+* равенство дисперсий может предполагаться либо нет — в зависимости от этого применяется один из критериев, описанных выше.
+'''Нулевая гипотеза''' <tex>H_0:\; \bar x + A = \bar y </tex> (средние в двух выборках отличаются на заданную величину).
+Модифицированная первая выборка <tex>x'_i = x_i + A</tex> сравнивается с исходной второй выборкой с помощью одного из критериев, описанных выше.
 == История ==
 Критерий был разработан Уильямом Госсеттом для оценки качества пива на пивоваренных заводах Гиннесса в Дублине (Ирландия). В&nbsp;связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсетта вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).
 == Литература ==
-# ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006.
+# ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006. — 816&nbsp;с.
 == Ссылки ==
 * [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез.
 * [[Статистика (функция выборки)]]
-* [http://en.wikipedia.org/wiki/Student%27s_t-test Student's t-test] — статья в англоязычной Википедии.
+* [http://en.wikipedia.org/wiki/Student%27s_t-test Student's t-test] (Wikipedia).
-* [http://ru.wikipedia.org/wiki/%D0%9A%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9_%D0%A1%D1%82%D1%8C%D1%8E%D0%B4%D0%B5%D0%BD%D1%82%D0%B0 t-критерий Стьюдента] — статья в русской Википедии.
+* [http://ru.wikipedia.org/wiki/%D0%9A%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9_%D0%A1%D1%82%D1%8C%D1%8E%D0%B4%D0%B5%D0%BD%D1%82%D0%B0 t-критерий Стьюдента] (Википедия).
+* [http://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_%D0%A1%D1%82%D1%8C%D1%8E%D0%B4%D0%B5%D0%BD%D1%82%D0%B0 Распределение Стьюдента] (Википедия).
+* [http://ru.wikipedia.org/wiki/%D0%9A%D0%B2%D0%B0%D0%BD%D1%82%D0%B8%D0%BB%D0%B8_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D1%8F_%D0%A1%D1%82%D1%8C%D1%8E%D0%B4%D0%B5%D0%BD%D1%82%D0%B0 Квантили распределения Стьюдента] (Википедия).
-{{Stub}}
 [[Категория:Статистические тесты]]
 [[Категория:Параметрические статистические тесты]]
 [[Категория:Популярные и обзорные статьи]]

Критерий Стьюдента

Материал из MachineLearning.

Текущая версия

Содержание

Примеры задач

Варианты применения

Сравнение выборочного среднего с заданным значением

Сравнение двух выборочных средних при известных дисперсиях

Сравнение двух выборочных средних при неизвестных равных дисперсиях

Сравнение двух выборочных средних при неизвестных неравных дисперсиях

Сравнение двух выборочных средних в связанных выборках

Сравнение разности средних с заданным значением

История

Литература

Ссылки

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты