Нормализация ДНК-микрочипов
Материал из MachineLearning.
(→Масштабирование) |
(→Схема выполнения масштабирования) |
||
Строка 13: | Строка 13: | ||
Affymetrix предлагает использовать этот вид нормализации на последнем этапе предобработки, применяя масштабирование непосредственно к матрицам экспрессии, однако, возможно и его применение к матрицам интенсивности. | Affymetrix предлагает использовать этот вид нормализации на последнем этапе предобработки, применяя масштабирование непосредственно к матрицам экспрессии, однако, возможно и его применение к матрицам интенсивности. | ||
- | ====Схема выполнения масштабирования==== | + | =====Схема выполнения масштабирования===== |
# Выбрать столбец <tex>j</tex> матрицы <tex>X</tex> в качестве базового. | # Выбрать столбец <tex>j</tex> матрицы <tex>X</tex> в качестве базового. | ||
# Вычислить (усечённое) среднее <tex>\tilde{X}_j</tex> по столбцу <tex>j</tex> | # Вычислить (усечённое) среднее <tex>\tilde{X}_j</tex> по столбцу <tex>j</tex> |
Версия 14:45, 6 мая 2010
Нормализация - важный этап предобработки ДНК-микрочипов, позволяющий сделать несколько рассматриваемых в эксперименте чипов пригодными к сравнению между собой. Основная цель анализа на этом этапе - исключить влияние систематических небиологических различий между микрочипами. Источников таких различий множество: вариации эффективности обратной транскрипции, маркировки красителями, гибридизации, физические различия между чипами (повреждения, царапины), небольшие различия в концентрации реагентов, вариация лабораторных условий.
Содержание |
Парадигмы нормализации
Нормализация на все гены, нормализация на гены домашнего хозяйства, нормализация на стабильные гены[1]
Методы нормализации
Масштабирование
Один из ДНК-микрочипов выбирается в качестве базового, затем все остальные масштабируются таким образом, чтобы их средняя интенсивность равнялась средней интенсивности базового (этот способ эквивалентен построению линейной регрессии каждого чипа на базовый и последующей нормализации при помощи регрессионной функции).
Для большей устойчивости можно использовать усечённое среднее. Так, в стандартном программном обеспечении производителя микрочипов Affymetrix перед подсчётом среднего отбрасываются по 2 % наибольших и наименьших значений интенсивности. Другая модификация — масштабирование к средней интенсивности не по всему базовому чипу, а по каждому подмножеству его проб, соответствующих одному гену.
Affymetrix предлагает использовать этот вид нормализации на последнем этапе предобработки, применяя масштабирование непосредственно к матрицам экспрессии, однако, возможно и его применение к матрицам интенсивности.
Схема выполнения масштабирования
- Выбрать столбец матрицы в качестве базового.
- Вычислить (усечённое) среднее по столбцу
- Для всех остальных столбцов матрицы : вычислить (усечённое) среднее по столбцу ; вычислить ; каждый элемент столбца умножить на .
Нелинейные методы
Предложено большое количество нелинейных способов cross-validated splines[1], running median lines[1], loess smoothers[1]