Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 774, осень 2010

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м
м
Строка 1: Строка 1:
-
{{__NOTOC__}}
+
__NOTOC__
* Численные методы обучения по прецедентам ([[Численные методы обучения по прецедентам (практика, В.В. Стрижов)|программа курса]])
* Численные методы обучения по прецедентам ([[Численные методы обучения по прецедентам (практика, В.В. Стрижов)|программа курса]])
* Автоматизация и стандартизация научных исследований ([[Автоматизация и стандартизация научных исследований (практика, В.В. Стрижов)|программа курса]])
* Автоматизация и стандартизация научных исследований ([[Автоматизация и стандартизация научных исследований (практика, В.В. Стрижов)|программа курса]])
Строка 23: Строка 23:
| С.Н. Агеев
| С.Н. Агеев
| Данные будут подготовлены, открытость обсудим
| Данные будут подготовлены, открытость обсудим
 +
|-
 +
| [[Порождение суперпозиций при выборе модели кредитного скоринга (пример)]]
 +
|
 +
|
 +
| В.В. Стрижов
 +
| Данные открыты
|-
|-
| [[Долгосрочное прогнозирование ежедневных цен на электроэнергию (пример)]]
| [[Долгосрочное прогнозирование ежедневных цен на электроэнергию (пример)]]

Версия 15:30, 30 июня 2010

Задачи

Название задачи Работу выполняет Работу рецензируют Задачу предложил Комментарии
Прогнозирование класса третичной структуры белка по первичной (пример) И.Ю. Торшин Данные открыты
Поиск нелинейной модели поверхности Мохоровичича (пример) С.Н. Агеев Данные будут подготовлены, открытость обсудим
Порождение суперпозиций при выборе модели кредитного скоринга (пример) В.В. Стрижов Данные открыты
Долгосрочное прогнозирование ежедневных цен на электроэнергию (пример) М. Хильдман Данные есть
Краткосрочное прогнозирование почасовых цен на электроэнергию (пример) Г.-В. Вебер Идут переговоры об открытии данных
Макроэкономическое моделирование и модели принятия решений (пример) В.В. Стрижов Данные есть
Прогнозирование концентрации кислорода в выхлопных газах дизельного двигателя (пример) В.В. Стрижов Данные будут
Оценка эффективности природоохранных программ (пример) В.В. Стрижов (П. Летмате?) Данных пока нет (в евр. комм. по энергетике, но неясно, какие использовать)

Прогнозирование класса третичной структуры белка по первичной (пример)

Требуется предложить алгоритм порождения признаков для восстановления регресии. При выборе признаков класс моделей (RBF, обсуждается) и метод выбора (метод моделей наибольшего правдоподобия) будут фиксированы.

Предлагается использовать базу данных "ASTRAL SCOP Genetic Domain Sequences 1.75"[1], архив PDB SEQRES records: astral-scopdom-seqres-gd-all-1.75.fa[2]

Структура данных

>d1dlya_ a.1.1.1 (A:) Protozoan/bacterial hemoglobin {Green alga (Chlamydomonas eugametos) [TaxId: 3054]}
slfaklggreaveaavdkfynkivadptvstyfsntdmkvqrskqfaflayalggasewk
gkdmrtahkdlvphlsdvhfqavarhlsdtltelgvppeditdamavvastrtevlnmpq
  • d1dlya_ -- идентификатор эксперимента (код файла в PDB),
  • a.1.1.1 -- классификатор белка, иерархическая структура разделена точками,
  • slfaklggreavea... -- последовательность аминокислот (без пробелов и переносов до символа >).


Поиск нелинейной модели поверхности Мохоровичича (пример)

Черновик. Исследуется проблема разделения наблюденного (измеренного) поля силы тяжести на две компоненты. Одна должна отражать влияние границы разделяющая земную кору и мантию Земли (так называемая поверхность Мохоровичича или просто Мохо), а вторая собственно влияние самой земной коры. Специалистов, которые занимались и занимаются уточнением глубины до поверхности Мохо и проблемой ИЗОСТАЗИИ много, выполненных сейсмических работ по данной тематике (Глубинные сеймические зондирования ГСЗ) тоже много, опубликованных работ еще больше. Если бы эталоная выборка по данным ГСЗ была хорошей (равноточной и равномерной по площади) тогда построить глубину до Мохо H=f(x,y) по экспериментальным данным с некоторой детальностью (естественно не выше некоторых пространственных частот) проблемы в целом не составляет. Задача состоит в детализации H=f(x,y) используя поле силы тяжести G измеренное с большей детальностью чем эталонная выборка. И тогда надо построить H=f(x,y,G(x,y)). Само поле силы тяжести осложнено влиянием аномалий поля силы тяжести от некоторого количества известных и неизвестных изолированных объектов A_i, и от влияния некоторого количества границ раздела \Gamma_i. Тогда все превращается в H=f(x,y,G(x,y,A_i,\Gamma_i)).

В дополнение ко всему может так получиться, что для некоторых ограниченных областей, несмотря на наши расчеты и полученные зависимости глубины H из геологических данных могут быть такими и только такими, т.е. модели в таких областях будут отличны.

Коллоквиум

  • Начало октября

Доклад по результатам постановки задач и иссследованию литературы на пять минут. Требуется:

  • Аннотация работы, 600 знаков
  • Список литературы и оценка близости используемых методов
  • Постановка задачи
  • Пути решения задачи
  • Ожидаемые результаты

Экзамен

Конец ноября

Личные инструменты