Нормализация ДНК-микрочипов
Материал из MachineLearning.
м (→Нелинейные методы) |
м |
||
Строка 11: | Строка 11: | ||
=== Нелинейные методы=== | === Нелинейные методы=== | ||
- | cross-validated splines, running median lines, loess smoothers | + | cross-validated splines, running median lines, loess smoothers<ref name="smoothers">Bolstad BM, Irizarry RA, Astrand M, Speed TP. A comparison of normalization methods for high density oligonucleotide array data based on variance and bias. Bioinformatics. 2003;19(2):185-193. http://www.ncbi.nlm.nih.gov/pubmed/12538238</ref> |
=== Квантильная нормализация=== | === Квантильная нормализация=== | ||
Строка 17: | Строка 17: | ||
[[Алгоритм LOWESS]] | [[Алгоритм LOWESS]] | ||
=== LVS-нормализация === | === LVS-нормализация === | ||
- | <ref name="lvs"> | + | <ref name="lvs">Calza S, Valentini D, Pawitan Y. Normalization of oligonucleotide arrays based on the least-variant set of genes. BMC bioinformatics. 2008;9(140). http://www.ncbi.nlm.nih.gov/pubmed/18318917.</ref> |
== Примечания == | == Примечания == |
Версия 11:55, 6 мая 2010
Нормализация - важный этап предобработки ДНК-микрочипов, позволяющий сделать несколько рассматриваемых в эксперименте чипов пригодными к сравнению между собой. Основная цель анализа на этом этапе - исключить влияние систематических небиологических различий между микрочипами. Источников таких различий множество: вариации эффективности обратной транскрипции, маркировки красителями, гибридизации, физические различия между чипами (повреждения, царапины), небольшие различия в концентрации реагентов, вариация лабораторных условий.
Используются следующие методы нормализации.
Содержание |
Масштабирование
Один из ДНК-микрочипов выбирается в качестве базового, затем все остальные масштабируются таким образом, чтобы их средняя интенсивность равнялась средней интенсивности базового (этот способ эквивалентен построению линейной регрессии каждого чипа на базовый и последующей нормализации при помощи регрессионной функции).
Для большей устойчивости можно использовать усечённое среднее. Так, в стандартном программном обеспечении производителя микрочипов Affymetrix перед подсчётом среднего отбрасываются по 2% наибольших и наименьших значений интенсивности. Другая модификация - масштабирование к средней интенсивности не по всему базовому чипу, а по каждому подмножеству его проб, соответствующих одному гену.
Affymetrix предлагает использовать этот вид нормализации на последнем этапе предобработки, применяя масштабирование непосредственно к матрицам экспрессии, однако, возможно и его применение к матрицам интенсивности.
Нелинейные методы
cross-validated splines, running median lines, loess smoothers[1]