Нормализация ДНК-микрочипов
Материал из MachineLearning.
м |
м (→Парадигмы нормализации) |
||
Строка 2: | Строка 2: | ||
== Парадигмы нормализации == | == Парадигмы нормализации == | ||
- | Нормализация на все гены, нормализация на гены домашнего хозяйства | + | Нормализация на все гены, нормализация на гены домашнего хозяйства, нормализация на стабильные гены<ref name="lvs">Calza S, Valentini D, Pawitan Y. Normalization of oligonucleotide arrays based on the least-variant set of genes. BMC bioinformatics. 2008;9(140). http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2324100/.</ref> |
== Методы нормализации == | == Методы нормализации == |
Версия 12:48, 6 мая 2010
Нормализация - важный этап предобработки ДНК-микрочипов, позволяющий сделать несколько рассматриваемых в эксперименте чипов пригодными к сравнению между собой. Основная цель анализа на этом этапе - исключить влияние систематических небиологических различий между микрочипами. Источников таких различий множество: вариации эффективности обратной транскрипции, маркировки красителями, гибридизации, физические различия между чипами (повреждения, царапины), небольшие различия в концентрации реагентов, вариация лабораторных условий.
Содержание |
Парадигмы нормализации
Нормализация на все гены, нормализация на гены домашнего хозяйства, нормализация на стабильные гены[1]
Методы нормализации
Масштабирование
Один из ДНК-микрочипов выбирается в качестве базового, затем все остальные масштабируются таким образом, чтобы их средняя интенсивность равнялась средней интенсивности базового (этот способ эквивалентен построению линейной регрессии каждого чипа на базовый и последующей нормализации при помощи регрессионной функции).
Для большей устойчивости можно использовать усечённое среднее. Так, в стандартном программном обеспечении производителя микрочипов Affymetrix перед подсчётом среднего отбрасываются по 2% наибольших и наименьших значений интенсивности. Другая модификация - масштабирование к средней интенсивности не по всему базовому чипу, а по каждому подмножеству его проб, соответствующих одному гену.
Affymetrix предлагает использовать этот вид нормализации на последнем этапе предобработки, применяя масштабирование непосредственно к матрицам экспрессии, однако, возможно и его применение к матрицам интенсивности.
Нелинейные методы
cross-validated splines[1], running median lines[1], loess smoothers[1]