Критерий Стьюдента

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(ссылки)
(добавлены примеры)
Строка 3: Строка 3:
'''t-критерий Стьюдента''' — общее название для [[статистический тест|статистических тестов]], в которых статистика критерия имеет [[распределение Стьюдента]]. Наиболее часто t-критерии применяются для проверки равенства средних значений в двух [[выборка]]х.
'''t-критерий Стьюдента''' — общее название для [[статистический тест|статистических тестов]], в которых статистика критерия имеет [[распределение Стьюдента]]. Наиболее часто t-критерии применяются для проверки равенства средних значений в двух [[выборка]]х.
-
Все разновидности критерия Стьюдента являются параметрическими и основаны на дополнительном предположении о нормальности выборки данных. Поэтому перед применением критерия Стьюдента рекомендуется выполнить [[Критерии нормальности|проверку нормальности]]. Если гипотеза нормальности отвергается, можно проверить другие распределения, или использовать [[:Категория:Непараметрические статистические тесты|непараметрические статистические тесты]].
+
Все разновидности критерия Стьюдента являются параметрическими и основаны на дополнительном предположении о нормальности выборки данных. Поэтому перед применением критерия Стьюдента рекомендуется выполнить [[Критерии нормальности|проверку нормальности]]. Если гипотеза нормальности отвергается, можно проверить другие распределения, если и они не подходят, то следует воспользоваться [[:Категория:Непараметрические статистические тесты|непараметрические статистические тесты]].
 +
 
 +
== Примеры применения ==
 +
 
 +
Чаще всего критерий Стьюдента применяется для проверки равенства средних значений в двух выборках.
 +
 
 +
'''Пример 1.'''
 +
Первая выборка — это пациенты, которых лечили препаратом А.
 +
Вторая выборка — пациенты, которых лечили препаратом Б.
 +
Значения в выборках — это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.)
 +
Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.
 +
 
 +
'''Пример 2.'''
 +
Первая выборка — это значения некоторой характеристики состояния пациентов, записанные ''до'' лечения.
 +
Вторая выборка — это значения ''той же'' характеристики состояния ''тех же'' пациентов, записанные ''после'' лечения.
 +
Объёмы обеих выборок обязаны совпадать; более того, порядок элементов (в данном случае пациентов) в выборках также обязан совпадать.
 +
Такие выборки называются ''связными''.
 +
Требуется выяснить, имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны.
 +
 
 +
'''Пример 3.'''
 +
Первая выборка — это поля, обработанные агротехническим методом А.
 +
Вторая выборка — поля, обработанные агротехническим методом Б.
 +
Значения в выборках — это урожайность.
 +
Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.
 +
 
 +
'''Пример 4.'''
 +
Первая выборка — это дни, когда в супермаркете проходила промо-акция типа А (красные ценники со скидкой).
 +
Вторая выборка — дни промо-акции типа Б (каждая пятая пачка бесплатно).
 +
Значения в выборках — это показатель эффективности промо-акции (объём продаж, либо выручка в рублях).
 +
Требуется выяснить, какой из типов промо-акции более эффективен.
== Сравнение выборочного среднего с заданным значением ==
== Сравнение выборочного среднего с заданным значением ==

Версия 12:10, 14 августа 2008

Содержание

t-критерий Стьюдента — общее название для статистических тестов, в которых статистика критерия имеет распределение Стьюдента. Наиболее часто t-критерии применяются для проверки равенства средних значений в двух выборках.

Все разновидности критерия Стьюдента являются параметрическими и основаны на дополнительном предположении о нормальности выборки данных. Поэтому перед применением критерия Стьюдента рекомендуется выполнить проверку нормальности. Если гипотеза нормальности отвергается, можно проверить другие распределения, если и они не подходят, то следует воспользоваться непараметрические статистические тесты.

Примеры применения

Чаще всего критерий Стьюдента применяется для проверки равенства средних значений в двух выборках.

Пример 1. Первая выборка — это пациенты, которых лечили препаратом А. Вторая выборка — пациенты, которых лечили препаратом Б. Значения в выборках — это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.

Пример 2. Первая выборка — это значения некоторой характеристики состояния пациентов, записанные до лечения. Вторая выборка — это значения той же характеристики состояния тех же пациентов, записанные после лечения. Объёмы обеих выборок обязаны совпадать; более того, порядок элементов (в данном случае пациентов) в выборках также обязан совпадать. Такие выборки называются связными. Требуется выяснить, имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны.

Пример 3. Первая выборка — это поля, обработанные агротехническим методом А. Вторая выборка — поля, обработанные агротехническим методом Б. Значения в выборках — это урожайность. Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.

Пример 4. Первая выборка — это дни, когда в супермаркете проходила промо-акция типа А (красные ценники со скидкой). Вторая выборка — дни промо-акции типа Б (каждая пятая пачка бесплатно). Значения в выборках — это показатель эффективности промо-акции (объём продаж, либо выручка в рублях). Требуется выяснить, какой из типов промо-акции более эффективен.

Сравнение выборочного среднего с заданным значением

Задана выборка x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R}.

Дополнительное предположение: выборка нормальна.

Нулевая гипотеза H_0:\; \bar x = \mu (выборочное среднее равно заданному числу \mu).

Статистика критерия:

\displaystyle t = \frac{(\bar x - \mu)\sqrt{m}}{s}

имеет распределение Стьюдента с m-1 степенями свободы, где

\displaystyle \bar x = \frac1m \sum_{i=1}^m x_i — выборочное среднее,
\displaystyle s^2  = \frac1{m-1} \sum_{i=1}^m \left( x_i - \bar x \right)^2 — выборочная дисперсия.

Критерий (при уровне значимости \alpha):

  • против альтернативы H_1:\; \bar x \neq \mu
если  |t| > t_{\alpha/2} , то нулевая гипотеза отвергается;
  • против альтернативы H'_1:\; \bar x < \mu
если  t < t_{\alpha} , то нулевая гипотеза отвергается;
  • против альтернативы H''_1:\; \bar x > \mu
если  t > t_{1-\alpha} , то нулевая гипотеза отвергается;

где  t_{\alpha} есть \alpha-квантиль распределения Стьюдента с m-1 степенями свободы.

Сравнение двух выборочных средних при известных дисперсиях

Заданы две выборки x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}.

Дополнительные предположения:

  • обе выборки нормальны;
  • значения дисперсий  \sigma^2_x,\, \sigma^2_y известны априори; это означает, что дисперсии были оценены заранее не по этим выборкам, а исходя из какой-то другой информации; случай «неизвестных дисперсий», когда такого источника информации нет и дисперсии приходится оценивать по самим выборкам, описан ниже.

Нулевая гипотеза H_0:\; \bar x = \bar y (средние в двух выборках равны).

Статистика критерия:

z = (\bar x - \bar y) \left( \frac{\sigma^2_x}{m} +\frac{\sigma^2_y}{n} \right)^{-1/2}

имеет стандартное нормальное распределение \mathcal{N}(0,1), где

\displaystyle \bar x = \frac1m \sum_{i=1}^m x_i,\;\; \bar y = \frac1n \sum_{i=1}^n y_i — выборочные средние.

Критерий (при уровне значимости \alpha):

  • против альтернативы H_1:\; \bar x \neq \bar y
если  |z| > \Phi_{\alpha/2} , то нулевая гипотеза отвергается;
  • против альтернативы H'_1:\; \bar x < \bar y
если  z < \Phi_{\alpha} , то нулевая гипотеза отвергается;
  • против альтернативы H''_1:\; \bar x > \bar y
если  z > \Phi_{1-\alpha} , то нулевая гипотеза отвергается;

где  \Phi_{\alpha} есть \alpha-квантиль стандартного нормального распределения.

Сравнение двух выборочных средних при неизвестных равных дисперсиях

Заданы две выборки x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}.

Дополнительные предположения:

  • обе выборки нормальны;
  • значения дисперсий равны:  \sigma^2_x = \sigma^2_y , но априори не известны.

Нулевая гипотеза H_0:\; \bar x = \bar y (средние в двух выборках равны).

Статистика критерия:

t = \left( \frac{\bar x - \bar y}{s} \right) \sqrt{ \frac{mn}{m+n} }

имеет распределение Стьюдента с m+n-2 степенями свободы, где

\displaystyle s^2  = \frac{(m-1)s_x^2+(n-1)s_y^2}{m+n-2},\;\; s_x^2  = \frac1{m-1} \sum_{i=1}^m \left( x_i - \bar x \right)^2,\;\; s_y^2  = \frac1{n-1} \sum_{i=1}^n \left( y_i - \bar y \right)^2 — выборочные дисперсии;
\displaystyle \bar x = \frac1m \sum_{i=1}^m x_i,\;\; \bar y = \frac1n \sum_{i=1}^n y_i — выборочные средние.

Критерий (при уровне значимости \alpha):

  • против альтернативы H_1:\; \bar x \neq \bar y
если  |z| > t_{\alpha/2} , то нулевая гипотеза отвергается;
  • против альтернативы H'_1:\; \bar x < \bar y
если  z < t_{\alpha} , то нулевая гипотеза отвергается;
  • против альтернативы H''_1:\; \bar x > \bar y
если  z > t_{1-\alpha} , то нулевая гипотеза отвергается;

где  t_{\alpha} есть \alpha-квантиль распределения Стьюдента с m+n-2 степенями свободы.

Сравнение двух выборочных средних при неизвестных неравных дисперсиях

Задача сравнения средних двух нормально распределённых выборок при неизвестных и неравных дисперсиях известна как проблема Беренса-Фишера. Точного решения этой задачи до настоящего времени нет. На практике используются различные приближения.

Заданы две выборки x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}.

Дополнительное предположение: обе выборки нормальны.

Нулевая гипотеза H_0:\; \bar x = \bar y (средние в двух выборках равны).

Статистика критерия:

t = \frac{\bar x - \bar y}{s}

где

\displaystyle s^2  = \frac1m{s_x^2}  + \frac1n{s_y^2},\;\; s_x^2 = \frac1{m-1}\sum_{i=1}^m \left( x_i - \bar x \right)^2,\;\; s_y^2  = \frac1{n-1} \sum_{i=1}^n \left( y_i - \bar y \right)^2 — выборочные дисперсии;
\displaystyle \bar x = \frac1m \sum_{i=1}^m x_i,\;\; \bar y = \frac1n \sum_{i=1}^n y_i — выборочные средние.

Критерий (при уровне значимости \alpha):

  • против альтернативы H_1:\; \bar x \neq \bar y
если  t > t'_{\alpha/2} , то нулевая гипотеза отвергается;
  • против альтернативы H'_1:\; \bar x < \bar y
если  t < t'_{\alpha} , то нулевая гипотеза отвергается;
  • против альтернативы H''_1:\; \bar x > \bar y
если  t > t'_{1-\alpha} , то нулевая гипотеза отвергается;

где квантили  t'_{\alpha} определяются по-разному в различных приближениях:

  • Критерий Кохрена-Кокса:
 t'_{\alpha} = \frac{\nu_x t_{\alpha}(m-1) + \nu_y t_{\alpha}(n-1)}{\nu_x+\nu_y},\; \nu_x=\frac{s_x^2}m,\; \nu_y=\frac{s_y^2}n  , где  t_{\alpha}(f) есть \alpha-квантиль распределения Стьюдента с f степенями свободы;
  • Критерий Сатервайта:
 t'_{\alpha} есть \alpha-квантиль распределения Стьюдента с числом степеней свободы f = s^4\left( \frac1{1-m}\left(\frac{s_x^2}m\right)^2  + \frac1{1-n}\left(\frac{s_y^2}n\right)^2 \right)^{-1}.
  • Критерий Крамера-Уэлча:
 t'_{\alpha} есть \alpha-квантиль распределения Стьюдента с числом степеней свободы f = s^4\left( \frac1{1-m}\left(\frac{s_x^2}m\right)^2  + \frac1{1-n}\left(\frac{s_y^2}n\right)^2 \right)^{-1} - 2.

Сравнение двух выборочных средних в связанных выборках

Заданы две выборки одинаковой длины x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^m = (y_1,\ldots,y_m),\; y_i \in \mathbb{R}.

Дополнительные предположения:

  • обе выборки нормальны;
  • выборки связны, то есть элементы x_i,\: y_i соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).

Сравнение выборочных средних в связанных выборках ничем не отличается от сравнения среднего разности d_i = x_i - y_i с нулём.


История

Критерий был разработан Уильямом Госсеттом для оценки качества пива на пивоваренных заводах Гиннесса в Дублине (Ирландия). В связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсетта вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).


Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.

Ссылки

Личные инструменты