Критерий Гехана

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(создание статьи)
(создание статьи)
 

Текущая версия

Критерий Гехана - непараметрический статистический критерий, используемый для оценивания значимости различий в выживаемости двух групп.

Впервые был предложен Геханом в 1965г. как обобщение критерия Уилкоксона.

В 1967г. Мантел показал более простой способ вычисления критерия.

Содержание

Примеры задач

Пример 1. В Японии проводилось сравнение выживаемости (с момента постановки диагноза) детей с онкологическими заболеваниями в период с 1975-79гг. с выживаемостью в период 1980-84гг. Требовалось определить, позволили ли новые методы лечения продлить жизнь детей.

Пример 2. Для оценки общего состояния пожилого человека предполагается использовать так называемую шкалу повседневной работы по дому. В исследование включаются люди примерно одного возраста и делятся на 2 группы: с высокой и низкой оценкой по шкале повседневной работы по дому. Требуется сравнить выживаемость в обеих группах.

Описание критерия

Заданы две выборки (группы объектов) X^1 = (t_i^1,\; d_i^1,\; R_i^1)_{i=1}^{n_1} и X^2 = (t_i^2,\; d_i^2,\; R_i^2)_{i=1}^{n_2}, где

t_i^1 и t_i^2 - моменты времени,

d_i^1 и d_i^2 - число объектов, для которых произошел исход (смерть) в момент времени t_i,

R_i^1 и R_i^2 - число объектов, доживших до момента времени t_i, исключая выбывших.

Дополнительные предположения:

  • обе выборки независимы и случайны;
  • выбывание в обеих выборках одинаково.

Нулевая гипотеза H_0 состоит в том, что в обеих группах выживаемость одинакова, т.е. функции выживаемости равны: S_1(t)=S_2(t).

Статистика критерия:

  • Сначала каждый объект из 1-ой группы сравнивается с каждым объектом из 2-ой группы, результат сравнения \gamma_{ij} равен:
\gamma_{ij}=\left\{\;1,\;t_i>t_j,\\-1,\;t_i<t_j,\\ \;0.
последнее возможно в том случае, если оба объекта выбыли, либо i-ый объект выбыл до момента времени t_j, либо j-ый объект выбыл до момента врмени t_i, либо t_i=t_j.
  • Результаты сравнения для каждого объекта суммируются:
U = \sum\limits_{i=1}^{n_1}\sum\limits_{j=1}^{n_2}\gamma_{ij}.
  • Вычисляется оценка дисперсии V и статистика критерия Z_V:
V = \sqrt{\frac{n_1n_2}{(n_1+n_2)(n_1+n_2-1)}\sum\limits_{i=1}^{n_1}\left(\sum\limits_{j=1}^{n_2}\gamma_{ij}\right)^2},
Z_V = \frac{U}{V}.
  • Статистика Z_V приближенно имеет нормальное распределение N(0,1).

Замечание: существует и другой способ вычисления статистики:

Z = \frac{U^2}{V^2}
в этом случае Z распределена приближенно по закону \chi^2_1 с одной степенью свободы.

Критерий (при уровне значимости \alpha):

если Z_V > \Phi_{\alpha}, где \Phi_{\alpha} есть \alpha-квантиль нормального распределения, то нулевая гипотеза H_0 о случайности различий в выживаемости отвергается.

Примечание:

Критерий Гехана не требует постоянства отношения смертности (т.е. чтобы выполнялось равенство S_1(t)=\left[S_2(t)\right]^{\psi}), но на его результаты сильно влияет число ранних смертей.

Литература

  • Стентон Гланц Медико-биологическая статистика. Электронная книга = Primer of BIOSTATISTICS. — 4-е изд. — М.: Практика, 1999. — С. 459.

См. также

Ссылки

Личные инструменты