Биоинформатика и задачи распознавания в современной биологии (курс лекций, И.Ю. Торшин)
Материал из MachineLearning.
(→Лекция 3. Биологические данные, объекты и подходы к формализации задач) |
(→Лекция 4. Задачи 1D-1D -- сравнение и классификация символьных последовательностей) |
||
Строка 23: | Строка 23: | ||
=== Лекция 4. Задачи 1D-1D -- сравнение и классификация символьных последовательностей === | === Лекция 4. Задачи 1D-1D -- сравнение и классификация символьных последовательностей === | ||
+ | Экспериментальные методы секвенирования. Алгоритмы выравнивания и сравнения символьных последовательностей. Верификация данных из разных уровней иерархии клеточных процессов. Классификация последовательностей как подход к решению задач 1D>… | ||
=== Лекция 5. Задачи 1Dднк === | === Лекция 5. Задачи 1Dднк === |
Версия 12:18, 10 сентября 2010
Московский физико-технический институт, Факультет управления и прикладной математики
Курс читается студентам 6-го курса кафедры "Интеллектуальные системы"
Аннотация
Современную биологию отличает накопление огромных массивов разнородных данных при практически полном отсутствии каких-либо фундаментальных теоретических обощений. При такой ситуации в проблемной области, методы интеллектуального анализа данных являются основным инструментом исследователя. Особое внимание уделяется биомедицинским приложениям результатов интеллектуального анализа биологических данных. В курсе лекций рассмотрены уникальные особенности биологических данных, приводящие к задачам распознавания и классификации неизвестным в физике и химии. Формулируется система задач распознавания, отражающая структуру биологических систем. Рассмотрены основы формализма, разрабатываемого для решения задач биоинформатики и основанного на теории универсальных и локальных органичений в рамках алгебраического подхода к распознаванию.
Организационная часть
Данный курс следует расматривать как область практического приложения знаний, накопленных студентами за 5 лет обучения в МФТИ. Поэтому, курс лекций НЕ является только "общеобразовательным курсом". В настоящее время, семестровый курс содержит 32 часа лекций. В ходе лекций будут объявляться практические задания. Студенты могут сами формулировать темы исследовательских задач в ходе прослушивания лекций. После выбора задачи, обсуждаются требования к работе. До начала зачета (устное собеседование) необходимо сдать отчет об исследовательской работе (3-4 стр), проведенной по выбранной задачи из области биологии.
План лекций
Лекция 1. Проблемная область - биология
Биология - проблемная область. О данных и методах из области биологии. Уровни биологических систем и уровни данных. Взаимосвязь различных задач интеллектуального анализа биологических данных, системы задач распознавания и классификации
Лекция 2. От клеточной биологии к задачам распознавания
Клетка. Методы исследований клеток. Основные компоненты и процессы в клетках, их биологические роли и взаимодействия. ДНК. РНК. Аминокислоты и белки. Клеточная биология и система задач распознавания.
Лекция 3. Биологические данные, объекты и подходы к формализации задач
Биологические объекты и их описания. Объемы данных и степень их интеграции (связности). Противоречивость множеств прецедентов.
Лекция 4. Задачи 1D-1D -- сравнение и классификация символьных последовательностей
Экспериментальные методы секвенирования. Алгоритмы выравнивания и сравнения символьных последовательностей. Верификация данных из разных уровней иерархии клеточных процессов. Классификация последовательностей как подход к решению задач 1D>…