Суммаризация в анализе ДНК-микрочипов
Материал из MachineLearning.
Суммаризация — этап предобработки при анализе ДНК-микрочипов, в ходе которого интенсивности флуоресценции проб, соответствующих одному гену, обобщаются в оценку его экспрессии.
Для обеспечения устойчивости оценки уровня экспрессии к каждому гену на микрочипе имеется несколько проб; их последовательности комплементарны разным участкам последовательности их гена.
Усреднение интенсивностей
В комплексе методов предобработки MAS 5.0[1] для суммаризации используется взвешенное среднее Тьюки, вычисленное одношаговым методом. Усреднение выполняется независимо для каждого гена на каждом микрочипе и применяется к логарифмам интенсивностей флуоресценции проб.
Учёт особенностей проб
Интенсивности флуоресценции разных проб к одному и тому же гену могут отличаться на порядки, причём отличия между ними имеют в основном систематический характер. В комплексе методов предобработки RMA[1] делается попытка учесть эти различия в рамках следующей модели:
Здесь  — предобработанная (с вычтенным фоном и нормализованная) логирифмированная интенсивность флуоресценции пробы 
 к гену 
 на микрочипе 
, 
 — оценка экспрессии гена 
 на микрочипе 
 в логарифмической шкале, 
 — коэффициент аффинитивности 
-й пробы 
-му гену, 
 — случайная ошибка с нулевым средним. Для однозначности определения параметров предполагается дополнительно 
 для каждого гена. 
В RMA значения коэффициентов оцениваются при помощи алгоритма median polish[1].

