Логранговый критерий
Материал из MachineLearning.
Логранговый критерий или логарифмический ранговый критерий (англ. Logrank test) - это непараметричесикй критерий, используемый для сравнения двух кривых выживаемости. Критерий часто применяется в медицине и страховании.
Этот критерий был впервые предложен Натаном Мантелём и был назван "логранк критерием" Ричардом и Джулианом Пето.
Содержание |
Примеры задач
Пример 1
В больнице проводятся испытания нового лекартва. Для этого сравнивают 2 контрольные группы: в первой группе люди принимают новое лекарство, а во второй - плацебо или старое лекарство. Исходом в данном случае является, например, сердечный приступ. Требуется определить, насколько эффективно новое лекарство.
Пример 2
При лейкозе требуется пересадка костного мозга. Лучшими его донорами являются близкие родственники (аллотрансплантация). Однако не всегда есть у кого взять костный мозг. Тогда используется другой метод: костный мозг берётся у самого больного, очищается и вводится ему после терапии. Этот метод называется аутотрансплантация. Требуется сравнить выживаемость после алло- и аутотрансплонтации. [1]
Описание метода
В клинических исследования часто нужно сравнить выживаемость в разных группах пациентов. Для этого можно использовать логранговый критерий.
Нулевая гипотеза
Гипотеза состоит в том, что выживаемость в группах одинакова и различия случайны, т.е. функции выживаемости и , заданные по и соответственно, неразличимы.
и - число объектов, доживающих до момента времени , исключая выбывших, из первой и второй групп,
и - число объектов, для которых произошёл исход в момент времени в первой и второй группах.
Дополнительные предположения
Применение логрангового критерия основано на следующих трех допущениях:
- Две сравниваемые выборки независимы и случайны.
- Выбывание в обеих выборках одинаково.
- Функции выживаемости связаны соотношением: .Величина называется отношением смертности. Если , то кривые выживаемости совпадают. Если , люди во второй выборке умирают позже, чем в первой. И наоборот, если , позже умирают в первой выборке.
Ожидаемое число исходов в -й момент для первой выборки вычисляется по формуле:
,
где - общее число исходов в момент времени в обеих выборках,
- число объектов, доживжих до момента времени , исключая выбывших, в обеих выборках.
Аналогично вычисляется ожидаемое число исходов в -й момент для второй выборки:
А оценка дисперсии в -й момент равна
Статистика критерия
распределена приближенно по закону хи-квадрат с одной степенью свободы.
Критерий
Если , то гипотеза отвергается.
- -квантиль распределения хи-квадрат с одной степенью свободы.
Статистика критерия (другая форма)
Если же представить статистику критерия, как
,
то приблизительно имеет нормальное распределение. Если у двух групп одинаковые функции выживаемости, то статистика критерия приближённо имеет стандартное нормальное распределение.
Критерий
И если , где квантиль нормального распределения, то нулевая гипотеза отвергается.
Заметим, что совершенно неважно, для какой именно из групп вычисляется числитель статистики . Для второй группы равна по абсолютной величине для первой, но имеет противоположный знак.
Литература