Суммаризация в анализе ДНК-микрочипов
Материал из MachineLearning.
м (Новая: [[Изображение:Probes_to_genes_number_dist.png|thumb|250px|Распределение генов по числу проб к ним на микрочипе Affymetrix Human Gen...) |
м |
||
Строка 4: | Строка 4: | ||
Для обеспечения устойчивости оценки уровня экспрессии к каждому гену на микрочипе имеется несколько проб; их последовательности комплементарны разным участкам последовательности их гена. | Для обеспечения устойчивости оценки уровня экспрессии к каждому гену на микрочипе имеется несколько проб; их последовательности комплементарны разным участкам последовательности их гена. | ||
- | == | + | ==Одиночная суммаризация== |
- | В | + | В данном классе методов оценки экспрессии вычисляются для всех микрочипов независимо друг от друга. |
- | = | + | В комплексе методов предобработки MAS 5.0<ref name="affIM">Affymetrix. Statistical Algorithms Description Document. Technical report, Affymetrix, Santa Clara, CA, 2002. http://media.affymetrix.com/support/technical/whitepapers/sadd_whitepaper.pdf</ref> для суммаризации используется [[взвешенное среднее Тьюки]], вычисленное одношаговым методом. Усреднение применяется к логарифмам интенсивностей флуоресценции проб и выполняется независимо для каждого гена на каждом микрочипе. |
+ | |||
+ | ==Множественная суммаризация== | ||
+ | К данному классу методов относятся такие, которые для получения оценки экспрессии используют несколько микрочипов. | ||
[[Изображение:Summarize.png|thumb|250px|Интенсивности флуоресценции проб к одному и тому же гену в логарифмической шкале, каждая линия — один микрочип.]] | [[Изображение:Summarize.png|thumb|250px|Интенсивности флуоресценции проб к одному и тому же гену в логарифмической шкале, каждая линия — один микрочип.]] | ||
Версия 10:51, 20 октября 2011
Суммаризация — этап предобработки при анализе ДНК-микрочипов, в ходе которого интенсивности флуоресценции проб, соответствующих одному гену, обобщаются в оценку его экспрессии.
Для обеспечения устойчивости оценки уровня экспрессии к каждому гену на микрочипе имеется несколько проб; их последовательности комплементарны разным участкам последовательности их гена.
Одиночная суммаризация
В данном классе методов оценки экспрессии вычисляются для всех микрочипов независимо друг от друга.
В комплексе методов предобработки MAS 5.0[1] для суммаризации используется взвешенное среднее Тьюки, вычисленное одношаговым методом. Усреднение применяется к логарифмам интенсивностей флуоресценции проб и выполняется независимо для каждого гена на каждом микрочипе.
Множественная суммаризация
К данному классу методов относятся такие, которые для получения оценки экспрессии используют несколько микрочипов.
Интенсивности флуоресценции разных проб к одному и тому же гену могут отличаться на порядки, причём отличия между ними имеют в основном систематический характер. В комплексе методов предобработки RMA[1] делается попытка учесть эти различия в рамках следующей модели:
Здесь — предобработанная (с вычтенным фоном и нормализованная) логирифмированная интенсивность флуоресценции пробы к гену на микрочипе , — оценка экспрессии гена на микрочипе в логарифмической шкале, — коэффициент аффинитивности -й пробы -му гену, — случайная ошибка с нулевым средним. Для однозначности определения параметров предполагается дополнительно для каждого гена.
В RMA значения коэффициентов оцениваются при помощи алгоритма median polish[1].