Логранговый критерий

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
 
(1 промежуточная версия не показана)
Строка 1: Строка 1:
-
'''Логранговый критерий''' (англ. Logrank test) используется в статистике для сравнения двух кривых выживаемости. Этот непараметрический тест может быть применён, когда данные цензурированны справа. Его очень часто используют в медицине при аппробации нового лекарства.
+
'''Логранговый критерий или логарифмический ранговый критерий''' (англ. Logrank test) - это непараметричесикй критерий, используемый для сравнения двух кривых выживаемости. Критерий часто применяется в медицине и страховании.
Этот критерий был впервые предложен Натаном Мантелём и был назван "логранк критерием" Ричардом и Джулианом Пето.
Этот критерий был впервые предложен Натаном Мантелём и был назван "логранк критерием" Ричардом и Джулианом Пето.
-
==Пример задачи==
+
==Примеры задач==
-
В больнице проводятся испытания нового лекартва. Для этого сравнивают 2 контрольные группы: в первой группе люди принимают новое лекарство, а во второй - плацебо. Измеряется время до какого-то событий (например, сердечного приступа).
+
===Пример 1===
 +
В больнице проводятся испытания нового лекартва. Для этого сравнивают 2 контрольные группы: в первой группе люди принимают новое лекарство, а во второй - плацебо или старое лекарство. Исходом в данном случае является, например, сердечный приступ. Требуется определить, насколько эффективно новое лекарство.
 +
 
 +
===Пример 2===
 +
При лейкозе требуется пересадка костного мозга. Лучшими его донорами являются близкие родственники (аллотрансплантация). Однако не всегда есть у кого взять костный мозг. Тогда используется другой метод: костный мозг берётся у самого больного, очищается и вводится ему после терапии. Этот метод называется аутотрансплантация. Требуется сравнить выживаемость после алло- и аутотрансплонтации.
 +
<ref name="Glanc">{{книга
 +
|автор = Стентон Гланц
 +
|заглавие = Медико-биологическая статистика. Электронная книга
 +
|оригинал = Primer of BIOSTATISTICS
 +
|ссылка =
 +
|издание = 4-е изд
 +
|место = М.
 +
|издательство = Практика
 +
|год = 1999
 +
|страницы = 459
 +
}}</ref>
==Описание метода==
==Описание метода==
-
===Исходные данные===
+
В клинических исследования часто нужно сравнить выживаемость в разных группах пациентов. Для этого можно использовать логранговый критерий.
-
<tex>i\in\{1,\cdots,T\}</tex>
+
-
<tex>t_i</tex> - момент времени
+
===Нулевая гипотеза===
 +
[[Нулевая гипотеза|Гипотеза <tex>H_0</tex>]] состоит в том, что выживаемость в группах одинакова и различия случайны, т.е. [[Функция выживаемости|функции выживаемости]] <tex>S_1(t)</tex> и <tex>S_2(t)</tex>, заданные по <tex>\{R_i^1,d_i^1\}</tex> и <tex>\{R_i^2,d_i^2\}</tex> соответственно, неразличимы.
-
<tex>R_i</tex> - число объектов, доживающих до момента времени <tex>t_i</tex>, исключая выбывших
+
<tex>R_i^1</tex> и <tex>R_i^2</tex>- число объектов, доживающих до момента времени <tex>t_i</tex>, исключая выбывших, из первой и второй групп,
-
<tex>d_i</tex> - число объектов, для которых произошёл исход в момент времени <tex>t_i</tex>
+
<tex>d_i^1</tex> и <tex>d_i^2</tex> - число объектов, для которых произошёл исход в момент времени <tex>t_i</tex> в первой и второй группах.
-
===Определение===
+
===Дополнительные предположения===
-
Требуется Сравненить две кривые выживаемости.
+
Применение логрангового критерия основано на следующих трех допущениях:
 +
* Две сравниваемые выборки независимы и случайны.
 +
* Выбывание в обеих выборках одинаково.
 +
* [[Функция выживаемости|Функции выживаемости]] связаны соотношением: <tex>S_2(t)=(S_1(t))^{\psi}</tex>.Величина <tex>\psi</tex> называется отношением смертности. Если <tex>\psi =1</tex>, то кривые выживаемости совпадают. Если <tex>\psi <1</tex>, люди во второй выборке умирают позже, чем в первой. И наоборот, если <tex>\psi >1</tex>, позже умирают в первой выборке.
-
'''Гипотеза''' <tex>H_0</tex>: различия случайны, т.е. <tex>S_1(t)</tex> и <tex>S_2(t)</tex> неразличимы.
 
-
Ожидаемое число исходов в <tex>i</tex>-й момент
+
Ожидаемое число исходов в <tex>i</tex>-й момент для первой выборки вычисляется по формуле:
-
<tex>E_t^1=\frac{R_i^1}{R_i^1+R_i^2}(d_i^1+d_i^2)</tex>
+
<tex>E_t^1=\frac{R_i^1}{R_i^1+R_i^2}(d_i^1+d_i^2)</tex>,
 +
 
 +
где <tex>d_i^1+d_i^2</tex> - общее число исходов в момент времени <tex>t_i</tex> в обеих выборках,
 +
 
 +
<tex>R_i^1+R_i^2</tex> - число объектов, доживжих до момента времени <tex>t_i</tex>, исключая выбывших, в обеих выборках.
 +
 
 +
Аналогично вычисляется ожидаемое число исходов в <tex>i</tex>-й момент для второй выборки:
<tex>E_t^2=\frac{R_i^2}{R_i^1+R_i^2}(d_i^1+d_i^2)</tex>
<tex>E_t^2=\frac{R_i^2}{R_i^1+R_i^2}(d_i^1+d_i^2)</tex>
-
<tex>V_i=\frac{R_i^1 R_i^2(d_i^1+d_i^2)(R_i^1+R_i^2-d_i^1-d_i^2)}{(R_i^1+R_i^2)(R_i^1+R_i^2-1)}</tex> - оценка дисперсии
+
А оценка дисперсии в <tex>i</tex>-й момент равна
 +
 
 +
<tex>V_i=\frac{R_i^1 R_i^2(d_i^1+d_i^2)(R_i^1+R_i^2-d_i^1-d_i^2)}{(R_i^1+R_i^2)^2 (R_i^1+R_i^2-1)}</tex>
===Статистика критерия===
===Статистика критерия===
-
'''Логранговый критерий'''
+
 
-
<tex>LR=\frac{\max_k(\sum_i d_i^k - \sum_i E_i^k)}{\sum_i V_i}</tex>
+
<tex>LR=\frac{\max_k(\sum_i d_i^k - \sum_i E_i^k)^2}{\sum_i V_i}</tex>
<tex>LR</tex> распределена приближенно по закону хи-квадрат с одной степенью свободы.
<tex>LR</tex> распределена приближенно по закону хи-квадрат с одной степенью свободы.
-
Если <tex>LR>\chi_{1,\alpha}^2</tex>, то <tex>H_0</tex> отвергается.
+
===Критерий===
 +
Если <tex>LR>\chi_{1,\alpha}^2</tex>, то гипотеза <tex>H_0</tex> отвергается.
 +
 
 +
<tex>\chi_{1,\alpha}^2</tex> - <tex>\alpha</tex>-[[Квантиль|квантиль]] распределения хи-квадрат с одной степенью свободы.
 +
 
 +
===Статистика критерия (другая форма)===
 +
Если же представить статистику критерия, как
 +
 
 +
<tex>Z=\frac{\sum_i(d_i^1-E_i^1)}{\sqr{\sum_i V_i}}</tex>,
 +
 
 +
то <tex>Z</tex> приблизительно имеет нормальное распределение. Если у двух групп одинаковые функции выживаемости, то статистика критерия <tex>Z</tex> приближённо имеет стандартное нормальное распределение.
 +
 
 +
===Критерий===
 +
И если <tex>Z>\Phi_\alpha</tex>, где <tex>\Phi_\alpha</tex> [[Квантиль|квантиль]] нормального распределения, то [[Нулевая гипотеза| нулевая гипотеза]] отвергается.
 +
 
 +
Заметим, что совершенно неважно, для какой именно из групп вычисляется числитель статистики <tex>Z</tex>. Для второй группы <tex>Z</tex> равна по абсолютной величине <tex>Z</tex> для первой, но имеет противоположный знак.
 +
 
 +
 
== Литература ==
== Литература ==
-
* {{книга
+
<references/>
-
|автор = Стентон Гланц
+
-
|заглавие = Медико-биологическая статистика. Электронная книга
+
-
|оригинал = Primer of BIOSTATISTICS
+
-
|ссылка =
+
-
|издание = 4-е изд
+
-
|место = М.
+
-
|издательство = Практика
+
-
|год = 1999
+
-
|страницы = 459
+
-
}}
+
Строка 61: Строка 93:
[[Категория: Прикладная статистика]][[Категория:Анализ выживаемости]]
[[Категория: Прикладная статистика]][[Категория:Анализ выживаемости]]
-
{{UnderConstruction|[[Участник:Ekaterina Mikhaylova|Ekaterina Mikhaylova]] 06:18, 11 января 2009 (MSK)}}
 

Текущая версия

Логранговый критерий или логарифмический ранговый критерий (англ. Logrank test) - это непараметричесикй критерий, используемый для сравнения двух кривых выживаемости. Критерий часто применяется в медицине и страховании.

Этот критерий был впервые предложен Натаном Мантелём и был назван "логранк критерием" Ричардом и Джулианом Пето.

Содержание

Примеры задач

Пример 1

В больнице проводятся испытания нового лекартва. Для этого сравнивают 2 контрольные группы: в первой группе люди принимают новое лекарство, а во второй - плацебо или старое лекарство. Исходом в данном случае является, например, сердечный приступ. Требуется определить, насколько эффективно новое лекарство.

Пример 2

При лейкозе требуется пересадка костного мозга. Лучшими его донорами являются близкие родственники (аллотрансплантация). Однако не всегда есть у кого взять костный мозг. Тогда используется другой метод: костный мозг берётся у самого больного, очищается и вводится ему после терапии. Этот метод называется аутотрансплантация. Требуется сравнить выживаемость после алло- и аутотрансплонтации. [1]


Описание метода

В клинических исследования часто нужно сравнить выживаемость в разных группах пациентов. Для этого можно использовать логранговый критерий.

Нулевая гипотеза

Гипотеза H_0 состоит в том, что выживаемость в группах одинакова и различия случайны, т.е. функции выживаемости S_1(t) и S_2(t), заданные по \{R_i^1,d_i^1\} и \{R_i^2,d_i^2\} соответственно, неразличимы.

R_i^1 и R_i^2- число объектов, доживающих до момента времени t_i, исключая выбывших, из первой и второй групп,

d_i^1 и d_i^2 - число объектов, для которых произошёл исход в момент времени t_i в первой и второй группах.

Дополнительные предположения

Применение логрангового критерия основано на следующих трех допущениях:

  • Две сравниваемые выборки независимы и случайны.
  • Выбывание в обеих выборках одинаково.
  • Функции выживаемости связаны соотношением: S_2(t)=(S_1(t))^{\psi}.Величина \psi называется отношением смертности. Если \psi =1, то кривые выживаемости совпадают. Если \psi <1, люди во второй выборке умирают позже, чем в первой. И наоборот, если \psi >1, позже умирают в первой выборке.


Ожидаемое число исходов в i-й момент для первой выборки вычисляется по формуле:

E_t^1=\frac{R_i^1}{R_i^1+R_i^2}(d_i^1+d_i^2),

где d_i^1+d_i^2 - общее число исходов в момент времени t_i в обеих выборках,

R_i^1+R_i^2 - число объектов, доживжих до момента времени t_i, исключая выбывших, в обеих выборках.

Аналогично вычисляется ожидаемое число исходов в i-й момент для второй выборки:

E_t^2=\frac{R_i^2}{R_i^1+R_i^2}(d_i^1+d_i^2)

А оценка дисперсии в i-й момент равна

V_i=\frac{R_i^1 R_i^2(d_i^1+d_i^2)(R_i^1+R_i^2-d_i^1-d_i^2)}{(R_i^1+R_i^2)^2 (R_i^1+R_i^2-1)}

Статистика критерия

LR=\frac{\max_k(\sum_i d_i^k - \sum_i E_i^k)^2}{\sum_i V_i}

LR распределена приближенно по закону хи-квадрат с одной степенью свободы.

Критерий

Если LR>\chi_{1,\alpha}^2, то гипотеза H_0 отвергается.

\chi_{1,\alpha}^2 - \alpha-квантиль распределения хи-квадрат с одной степенью свободы.

Статистика критерия (другая форма)

Если же представить статистику критерия, как

Z=\frac{\sum_i(d_i^1-E_i^1)}{\sqr{\sum_i V_i}},

то Z приблизительно имеет нормальное распределение. Если у двух групп одинаковые функции выживаемости, то статистика критерия Z приближённо имеет стандартное нормальное распределение.

Критерий

И если Z>\Phi_\alpha, где \Phi_\alpha квантиль нормального распределения, то нулевая гипотеза отвергается.

Заметим, что совершенно неважно, для какой именно из групп вычисляется числитель статистики Z. Для второй группы Z равна по абсолютной величине Z для первой, но имеет противоположный знак.


Литература


См. также

Ссылки

Личные инструменты