Фоновая поправка в анализе ДНК-микрочипов
Материал из MachineLearning.
Фоновая поправка - важный предварительный этап в анализе ДНК-микрочипов. Его необходимость связана с наличием таких мешающих факторов, как шум оптической системы распознавания и неспецифическая гибридизация.
Ideal mismatch
Изначально для анализа фонового эффекта была разработана система так называемых PM-MM проб. Помимо нуклеотидных зондов, в точности соответствующих последовательности каждого рассматриваемого гена (Perfect Match probes), на микрочипах Affymetrix GeneChip размещались зонды, в которых средний (тринадцатый) олигонуклеотид был заменён на комплементарный (Mismatch probe). Предполагалось, что по интенсивности MM-проб можно будет оценить эффект неспецифической гибридизации и вычесть его из интенсивности PM-проб. Этот подход сразу же продемонстрировал свою несостоятельность - было показано, что в среднем для ДНК-микрочипа интенсивность около 30% MM-проб превышает интенсивность соответствующих им PM-проб[1]. Из-за этого вычитание интенсивностей MM-проб приводит к бессмысленному результату, поскольку экспрессия гена оказывается отрицательной.
Чтобы нейтрализовать этот эффект, компанией Affymetrix была разработана концепция Ideal Mismatch[1]. Идея заключается в том, чтобы делать обычную PM-MM коррекцию там, где это возможно, а в остальных случаях вычитать из интенсивности PM-проб некоторую величину, меньшую интенсивности MM-проб. Для каждого множества проб, соответствующих одному участку ДНК, вычисляется значение специфической фоновой интенсивности , представляющее собой устойчивое к выбросам среднее по каждой паре проб в множестве логарифмов отношений PM-интенсивностей к MM-интенсивностям. Если - номер пробы, а - номер подмножества проб, то фоновый эффект оценивается следующим выражением:
Здесь и - настраиваемые параметры: - константа различия со значением по умолчанию 0.03, - константа масштабирования со значением по умолчанию 10. Итоговое значение интенсивности для PM-проб с учётом фоновой поправки получается вычитанием из исходных значений интенсивностей PM-проб соответствующей им величины .
RMA-свёртка
Данный метод фоновой коррекции является частью комплекса RMA методов для предобработки данных ДНК-микрочипов [1]. Используются только данные PM-проб. Значения интенсивности по ним корректируются отдельно по каждому микрочипу с использованием следующей модели распределения интенсивностей проб. Нескорректированное значение интенсивности представляется в виде суммы нормально распределённого шума со средним и дисперсией и экспоненциально распределённого сигнала со средним значением . Чтобы исключить возможность получения отрицательных значений интенсивности, рассматривается только неотрицательная часть нормального распределения. Корректировка производится согласно следующей формуле:
где , и - соответственно функция распределения и плотность стандартного нормального распределения.