Сравнение методов предобработки данных ДНК-микрочипов
Материал из MachineLearning.
(Новая: В задаче анализа ДНК-микрочипов очень важным является этап [[Предобработка данных ДНК-микрочипов|пре...) |
(→Методы сравнения алгоритмов) |
||
Строка 11: | Строка 11: | ||
**: Для визуализации строится график стандартного отклонения и матожидания экспрессии для каждого метода и гена в каждый момент времени. Сглаживающая прямая оптимального алгоритма должна быть близка к диагонали (оси соответствуют разным микрочипам). | **: Для визуализации строится график стандартного отклонения и матожидания экспрессии для каждого метода и гена в каждый момент времени. Сглаживающая прямая оптимального алгоритма должна быть близка к диагонали (оси соответствуют разным микрочипам). | ||
* '''False Positive Analysis''' | * '''False Positive Analysis''' | ||
- | *: Эксперименты на микрочипах выявляют уровень экспрессии тысяч генов одновременно. Многие из них на самом деле не экспрессируются, но [[Проверка статистических гипотез|статистические тесты]] (с уровнем значимости <tex>\alpha \sim 0.05</tex>) могут привести к большому числу неверно принятых гипотез (False Positives). Число неверно принятых гипотез после предобработки данных используется в качестве критерия сравнения алгоритмов и измеряет специфичность метода предобработки данных. | + | *: Эксперименты на микрочипах выявляют уровень экспрессии тысяч генов одновременно. Многие из них на самом деле не экспрессируются, но [[Проверка статистических гипотез|статистические тесты]] (с уровнем значимости <tex>\alpha \sim 0.05</tex>) могут привести к большому числу неверно принятых гипотез (False Positives). Число неверно принятых гипотез после предобработки данных используется в качестве критерия сравнения алгоритмов и измеряет специфичность метода предобработки данных. Так, можно построить график зависимости числа отвергнутых гипотез от [[Достигаемый уровень значимости|достигаемого уровня значимости]]: чем выше будет число отвергнутых гипотез, тем меньше вероятность неверно принять гипотезу, следовательно, тем лучше алгоритм. |
*: см. [[Проверка статистических гипотез]] | *: см. [[Проверка статистических гипотез]] | ||
- | + | * '''Построение [[Кривая ошибок|ROC-кривой]]''' | |
+ | *: В качестве сравнительного критерия качества алгоритмов часто используют площадь под ROC-кривой (AUC, area under curve). При построении ROC-кривой по оси абсцисс откладывается доля неверно принятых гипотез (FPR, false positive rate), а по оси ординат - доля верно принятых гипотез (TPR, true positive rate). Чем выше ROC-кривая и чем больше AUC - площадь под кривой, тем лучше считается алгоритм. | ||
---- | ---- | ||
Версия 10:37, 5 декабря 2010
В задаче анализа ДНК-микрочипов очень важным является этап предобработки данных. На сегодняшний день существует много методов предобработки, и появляются и развиваются новые. Однако определить, какой из методов работает лучше в той или иной ситуации, оказывается не так просто: экспериментальных данных немного и для них неизвестен конечный результат, поэтому напрямую оценить правильность работы алгоритма не представляется возможным. Обычно для сравнения методов предобработки данных используются модельные препараты, для которых известно, например, изменение уровня экспрессии генов. Критерии качества алгоритмов тоже могут быть разные в зависимости от эксперимента.
Содержание |
Методы сравнения алгоритмов
- Дисперсионный анализ
- Дисперсионный анализ используется для оценки способности метода уменьшать систематические ошибки, возникающие в ходе измерений. Если метод даёт большую дисперсию интенсивностей, то на этапе анализа возникнет больше ошибок в определении изменения уровня экспрессии генов. Этот подход базируется на двух критериях точности:
- Способность метода минимизировать разницу при попарном сравнении данных с нескольких микрочипов
- Теоретически, экспрессия генов не отличается для препаратов на одной стадии эксперимента, поэтому уровень экспрессии на нескольких микрочипах должен быть одинаков. Для попарного сравнения данных используются MA-графики, так как они наглядно иллюстрируют распределение интенсивностей и отношение логарифмов интенсивностей экспрессии. На MA-графике методы, для которых сглаживающая прямая ближе к оси абсцисс, считаются оптимальными, так как в этом случае гены с меньшей вероятностью будут неверно определены как меняющие уровень экспрессии.
- Точность измерения уровня экспрессии, оцениваемая с помощью стандартного отклонения по данным с разных микрочипов
- Для визуализации строится график стандартного отклонения и матожидания экспрессии для каждого метода и гена в каждый момент времени. Сглаживающая прямая оптимального алгоритма должна быть близка к диагонали (оси соответствуют разным микрочипам).
- False Positive Analysis
- Эксперименты на микрочипах выявляют уровень экспрессии тысяч генов одновременно. Многие из них на самом деле не экспрессируются, но статистические тесты (с уровнем значимости ) могут привести к большому числу неверно принятых гипотез (False Positives). Число неверно принятых гипотез после предобработки данных используется в качестве критерия сравнения алгоритмов и измеряет специфичность метода предобработки данных. Так, можно построить график зависимости числа отвергнутых гипотез от достигаемого уровня значимости: чем выше будет число отвергнутых гипотез, тем меньше вероятность неверно принять гипотезу, следовательно, тем лучше алгоритм.
- см. Проверка статистических гипотез
- Построение ROC-кривой
- В качестве сравнительного критерия качества алгоритмов часто используют площадь под ROC-кривой (AUC, area under curve). При построении ROC-кривой по оси абсцисс откладывается доля неверно принятых гипотез (FPR, false positive rate), а по оси ординат - доля верно принятых гипотез (TPR, true positive rate). Чем выше ROC-кривая и чем больше AUC - площадь под кривой, тем лучше считается алгоритм.
Сравнение некоторых алгоритмов предобработки данных
MAS5, LWPM, LWMM, RMA [1]
Авторы эксперимента провели сравнение четырёх алгоритмов предобработки данных ДНК-микрочипов: MAS5, LWPM, LWMM и RMA. Эксперимент был проведён на Affymetrix GenechipTM на лабораторных модельных данных человеческого генома (HG-U133A). Целью было выявление изменения экспрессии генов DLKP-клеток (deep laminar keratoplasty), обработанных аналогом тимидина (5-бромо-2-дезоксиуридином, BrdU), в течении трёх моментов времени: 0(исходные данные), 3 и 7 дней.
Результаты эксперимента
- Дисперсионный анализ
По результатам дисперсионного анализа лучшими оказались алгоритмы RMA и LWPM: для них сглаженная кривая на MA-графике приближалась к оси абсцисс, что означает небольшие изменения экспрессии в зависимости от концентрации генов, а значит потенциально меньший уровень неверно принятых гипотез. Метод RMA лучше остальных методов минимизировал различия в данных на разных микрочипах на одной стадии эксперимента (в один момент времени). Авторы также посчитали - коэффициент смешанной корреляции для каждого метода (статистический показатель, суммирующий объяснительную способность теста).
MAS 5.0 | LWPM | LWMM | RMA | |
---|---|---|---|---|
0 дней | 0.9265326 | 0.9904766 | 0.9724816 | 0.9952248 |
3 дня | 0.9165260 | 0.9857380 | 0.9603595 | 0.9930388 |
7 дней | 0.9080216 | 0.9649691 | 0.9434947 | 0.9850423 |
Среднее | 0.9170267 | 0.9803946 | 0.9587786 | 0.9911020 |
Таким образом, алгоритмы RMA и LWPM по сравнению с MAS5 и LWMM более обоснованно выявляют изменение в уровне экспрессии генов.
- False Positive Analysis
Целью сравнения было выявлить алгоритмы, неверно принимающих меньшее количество гипотез для заданного количества генов, изменивших уровень экспрессии. В качестве меры ошибки первого рода используются FDR и FWER. FDR даёт большее число отвергнутых гипотез, чем FWER, что подтверждает тот факт, что FWER более консервативна. Тем не менее, FWER позволяет лучше разделить алгоритмы по качеству: RMA и LWMM, согласно FWER, выделяют больше генов с различным уровнем экспрессии, чем MAS5 и LWPM (для заданной пи-величины). Мера FDR практически не позволяет различить качество методом MAS5 и RMA, в то время как LWMM работает немного лучше, чем LWPM. Сравнивая результаты параметрических и непараметрических подходов к множественной проверке гипотез, авторы эксперимента сделали вывод, что непараметрический критерий не позволяет различить качество алгоритмов предобработки данных, особенно по мере FWER.
Вывод: согласно дисперсионному анализу, алгоритмы RMA и LWPM превосходят остальные по качеству; согласно False Positive Analysis - алгоритмы LWMM и RMA принимают меньше неверных гипотез (замечание: в алгоритме LWMM используются пары проб PM(perfect match) и MM(miss match), в то время как в современных Affymetrix-чипах проб MM может не быть).
Литература
[1]Shakya, K; Ruskin, H J; Kerr, G et al. Comparison of Microarray Preprocessing Methods // Advances in Experimental Medicine and Biology. — 2010 T. 680. — С. 139-147.
Kogadeeva 01:33, 5 декабря 2010 (MSK)