Анализ выживаемости
Материал из MachineLearning.
Строка 42: | Строка 42: | ||
В анализе выживаемости есть несколько различных (в основном непараметрических) критериев для цензурированных данных: [[критерий Гехана|обобщенный (Геханом) критерий Вилкоксона]], F-критерий Кокса, [[Логранговый критерий|логранговый критерий]], обобщенный Пето (Peto R.и Peto J.) критерий Вилкоксона. Большинство этих критериев приводят значения стандартного нормального распределения; эти критерии могут быть использованы для статистической проверки любых различий между группами. Однако критерии дают надежные результаты лишь при достаточно больших объемах выборок. При малых объемах выборок их поведение менее поддается осмыслению. | В анализе выживаемости есть несколько различных (в основном непараметрических) критериев для цензурированных данных: [[критерий Гехана|обобщенный (Геханом) критерий Вилкоксона]], F-критерий Кокса, [[Логранговый критерий|логранговый критерий]], обобщенный Пето (Peto R.и Peto J.) критерий Вилкоксона. Большинство этих критериев приводят значения стандартного нормального распределения; эти критерии могут быть использованы для статистической проверки любых различий между группами. Однако критерии дают надежные результаты лишь при достаточно больших объемах выборок. При малых объемах выборок их поведение менее поддается осмыслению. | ||
+ | |||
+ | |||
+ | == Ссылки == | ||
+ | *[http://en.wikipedia.org/wiki/Survival_analysis Survival analysis] (Wikipedia) | ||
+ | *[http://www.statsoft.ru/home/textbook/modules/stsurvan.html#general Анализ выживаемости] (StatSoft) |
Версия 21:36, 11 января 2009
При исследовании препаратов, продлевающих жизнь и клинических испытаниях, наблюдения должно быть завершено до наступления исхода у всех больных. Наиболее типичным примером таких исследований - это исследование выживаемости, когда больных наблюдают от начала болезни до наступления смерти. Обычно больных включают в группу наблюдения на всём протяжении исследования, поэтому оно заканчивается до смерти последнего больного. Истинная продолжительность болезни выживших к концу исследования остаётся неизвестной. Естественно, нам не хотелось бы терять собранную о них информацию, поскольку большинство этих пациентов являются "выжившими" в течение того времени, которое вы их наблюдали, и тем самым свидетельствуют в пользу, например, нового метода лечения. Наблюдения, которые содержат неполную информацию, называются цензурированными наблюдениями.
Кроме того, исследователь может потерять больного из виду, если тот переехал в другой город или сменил клинику. Или больной может умереть по причине, не связанной с его болезнью, например в результате несчастного случая. Во всех этих случаях длительность заболевания остаётся неизвестной. Такие объекты мы будем называть выбывшими.
Поэтому можно выделить основные проблемы при анализе подобных задач:
- начало отсчёта
- выбывание (нет контроля за выборкой)
К анализу выживаемости неприменимы обычные способы оценки различий. Поэтому были созданы специальные методы, учитывающие цензурированность данных. Статистические методы, представленные в анализе выживаемости, первоначально были развиты в медицинских, биологических исследованиях и страховании, но затем стали широко применяться в социальных и экономических науках, а также в инженерных задачах (анализ надежности и времен отказов).
Содержание |
Примеры
- сравнить 2 метода лечения, протестировать новое лекартво
- оценить время службы автомобиля, телевизора, стиральной машины и т.п.
- сравнить время существования фирмы в данной отрасли в зависимости от выбранного фактора
Цензурированные данные
Неполные данные в исследованиях выживаемости называются цензурированными. Данные о выбывших пациентах цензурированны справа, если известен момент начала наблюдения, но неизвестен, когда произошёл исход. Если пациет страдал заболеванием ещё до начала исследования, то мы могли бы получить данные, цензурированные слева - пациент умер во время исследования или выбыл или данные, цензурированные с обеих сторон.
Термин цензурирование был впервые использован в работе Hald в 1949г.
Цензурированные данные типичны, когда исследуется время до наступления определённого события (исхода) и время исследований ограничено. Цензурированные наблюдения встречаются во многих областях. Например, в социальных науках мы можем изучать длительность брака. При этом к концу наблюдения возможно часть браков распалась, а часть - нет.
На рисунке показан ход исследования. Жизнь пациента представлена горизонтальным отрезком. Левый конец отрезка — это начало наблюдения. На правом конце отрезка — черный или белый кружок. Черный кружок означает, что пациент умер (произошёл исход) и, таким образом, продолжительность его жизни нам известна. Белый кружок означает, что исследование закончилось до его смерти, либо он куда-то уехал, т.е. выбыл из-под наблюдения. Относительно выбывших нам известно только, что они прожили не меньше определенного срока.
Все исследования выживаемости должны удовлетворять следующим требованиям:
- для всех наблюдений известно время начала наблюдения
- для всех наблюдаемых известно время окончаниея наблюдения, а так же умер он или выбыл
- выбор наблюдаемых произведён случайно
Математический аппарат анализа выживаемости
Кривая выживаемости задает вероятность пережить любой из моментов времени после некоторого начального события. Эту вероятность обычно называют выживаемостью или функцией выживаемости. С помощью этой кривой можно изучать продолжительность жизни, эффективность лечения заболевания ( в данном случае исход - это ремиссия), долговечность деталей автомобиля (исход - поломка).
Для оценивания кривой выживаемости используют процедуру Каплана-Мейера.
В анализе выживаемости есть несколько различных (в основном непараметрических) критериев для цензурированных данных: обобщенный (Геханом) критерий Вилкоксона, F-критерий Кокса, логранговый критерий, обобщенный Пето (Peto R.и Peto J.) критерий Вилкоксона. Большинство этих критериев приводят значения стандартного нормального распределения; эти критерии могут быть использованы для статистической проверки любых различий между группами. Однако критерии дают надежные результаты лишь при достаточно больших объемах выборок. При малых объемах выборок их поведение менее поддается осмыслению.
Ссылки
- Survival analysis (Wikipedia)
- Анализ выживаемости (StatSoft)