Логранговый критерий

Материал из MachineLearning.

Перейти к: навигация, поиск

Логранговый критерий или логарифмический ранговый критерий (англ. Logrank test) - это непараметричесикй критерий, используемый для сравнения двух кривых выживаемости. Критерий часто применяется в медицине и страховании.

Этот критерий был впервые предложен Натаном Мантелём и был назван "логранк критерием" Ричардом и Джулианом Пето.

Содержание

Примеры задач

Пример 1

В больнице проводятся испытания нового лекартва. Для этого сравнивают 2 контрольные группы: в первой группе люди принимают новое лекарство, а во второй - плацебо или старое лекарство. Исходом в данном случае является, например, сердечный приступ. Требуется определить, насколько эффективно новое лекарство.

Пример 2

При лейкозе требуется пересадка костного мозга. Лучшими его донорами являются близкие родственники (аллотрансплантация). Однако не всегда есть у кого взять костный мозг. Тогда используется другой метод: костный мозг берётся у самого больного, очищается и вводится ему после терапии. Этот метод называется аутотрансплантация. Требуется сравнить выживаемость после алло- и аутотрансплонтации. [1]


Описание метода

В клинических исследования часто нужно сравнить выживаемость в разных группах пациентов. Для этого можно использовать логранговый критерий.

Нулевая гипотеза

Гипотеза H_0 состоит в том, что выживаемость в группах одинакова и различия случайны, т.е. функции выживаемости S_1(t) и S_2(t), заданные по \{R_i^1,d_i^1\} и \{R_i^2,d_i^2\} соответственно, неразличимы.

R_i^1 и R_i^2- число объектов, доживающих до момента времени t_i, исключая выбывших, из первой и второй групп,

d_i^1 и d_i^2 - число объектов, для которых произошёл исход в момент времени t_i в первой и второй группах.

Дополнительные предположения

Применение логрангового критерия основано на следующих трех допущениях:

  • Две сравниваемые выборки независимы и случайны.
  • Выбывание в обеих выборках одинаково.
  • Функции выживаемости связаны соотношением: S_2(t)=(S_1(t))^{\psi}.Величина \psi называется отношением смертности. Если \psi =1, то кривые выживаемости совпадают. Если \psi <1, люди во второй выборке умирают позже, чем в первой. И наоборот, если \psi >1, позже умирают в первой выборке.


Ожидаемое число исходов в i-й момент для первой выборки вычисляется по формуле:

E_t^1=\frac{R_i^1}{R_i^1+R_i^2}(d_i^1+d_i^2),

где d_i^1+d_i^2 - общее число исходов в момент времени t_i в обеих выборках,

R_i^1+R_i^2 - число объектов, доживжих до момента времени t_i, исключая выбывших, в обеих выборках.

Аналогично вычисляется ожидаемое число исходов в i-й момент для второй выборки:

E_t^2=\frac{R_i^2}{R_i^1+R_i^2}(d_i^1+d_i^2)

А оценка дисперсии в i-й момент равна

V_i=\frac{R_i^1 R_i^2(d_i^1+d_i^2)(R_i^1+R_i^2-d_i^1-d_i^2)}{(R_i^1+R_i^2)^2 (R_i^1+R_i^2-1)}

Статистика критерия

LR=\frac{\max_k(\sum_i d_i^k - \sum_i E_i^k)^2}{\sum_i V_i}

LR распределена приближенно по закону хи-квадрат с одной степенью свободы.

Критерий

Если LR>\chi_{1,\alpha}^2, то гипотеза H_0 отвергается.

\chi_{1,\alpha}^2 - \alpha-квантиль распределения хи-квадрат с одной степенью свободы.

Статистика критерия (другая форма)

Если же представить статистику критерия, как

Z=\frac{\sum_i(d_i^1-E_i^1)}{\sqr{\sum_i V_i}},

то Z приблизительно имеет нормальное распределение. Если у двух групп одинаковые функции выживаемости, то статистика критерия Z приближённо имеет стандартное нормальное распределение.

Критерий

И если Z>\Phi_\alpha, где \Phi_\alpha квантиль нормального распределения, то нулевая гипотеза отвергается.

Заметим, что совершенно неважно, для какой именно из групп вычисляется числитель статистики Z. Для второй группы Z равна по абсолютной величине Z для первой, но имеет противоположный знак.


Литература


См. также

Ссылки

Личные инструменты