Fundam LLM bioinf

Материал из MachineLearning.

Версия от 16:19, 3 февраля 2025; Tiy (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

Подробное описание научной задачи

Несмотря на повсеместное использование (и очевидные успехи ряда отдельных приложений), т.н. большие языковые модели (ошибочно рубрицируемые непрофессиональным слэнгом вроде "искусственный интеллект") до сих пор не имеют никакого фундаментального математического обоснования их использования. Как результат, реальная эффективность и, в особенности, обобщающая способность соответствующих алгоритмов в принципе не могут быть оценены теоретически. Более того, полное отсутствие математической теории за конкретными реализациями таких моделей ставит под сомнение любые результаты оценки их "аккуратности" и обобщающей способности : ведь «хорошие» характеристики таких моделей могут быть просто артефактом хорошо «спрятанного» переобучения. Таким образом, насущно необходима основательная теоретическая проработка математических оснований таких моделей и алгоритмов, которая позволит формулировать научно-адекватные алгоритмы, планировать и проводить вычислительные эксперименты, дающие реалистичные оценки используемых функционалов аккуратности и обобщающей способности. В рамках данной темы практические приложения планируется брать из области биоинформатики. Также неотъемлемой частью этой темы является поиск высокоэффективных решений задач биоинформатики (распознавание гена, задачи биоинформатики белка, РНК-биоинформатика и др.) на альтернативных теоретических принципах (например, разработка общая теория алгоритмов выравнивания символьных последовательностей и оценки схожести этих последовательностей, комбинаторная теория разрешимости и др.).

Предварительные требования к студентам

Отличное владение теоретическими основами информатики и машинного обучения, долговременная заинтересованность студента в данной тематике, способность строго формулировать математические теории и проводить соответствующие вычислительные эксперименты, основанные на данных теориях

Комментарии

Список задач биоинформатики на странице курса МФТИ.

Личные инструменты