Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 774, осень 2010
Материал из MachineLearning.
(→Задачи) |
(→Задачи) |
||
Строка 9: | Строка 9: | ||
! Работу рецензируют | ! Работу рецензируют | ||
! Задачу предложил | ! Задачу предложил | ||
- | ! | + | ! Комментарии |
|- | |- | ||
| [[Прогнозирование класса третичной структуры белка по первичной (пример)]] | | [[Прогнозирование класса третичной структуры белка по первичной (пример)]] | ||
Строка 15: | Строка 15: | ||
| | | | ||
| И.Ю. Торшин | | И.Ю. Торшин | ||
+ | | Данные открыты | ||
+ | |- | ||
+ | | [[Поиск нелинейной модели поверхности Мохоровичича (пример)]] | ||
+ | | | ||
| | | | ||
+ | | С.Н. Агеев | ||
+ | | Данные будут подготовлены, открытость обсудим | ||
|- | |- | ||
| [[Долгосрочное прогнозирование ежедневных цен на электроэнергию (пример)]] | | [[Долгосрочное прогнозирование ежедневных цен на электроэнергию (пример)]] | ||
Строка 21: | Строка 27: | ||
| | | | ||
| М. Хильдман | | М. Хильдман | ||
- | | | + | | Данные есть |
|- | |- | ||
| [[Краткосрочное прогнозирование почасовых цен на электроэнергию (пример)]] | | [[Краткосрочное прогнозирование почасовых цен на электроэнергию (пример)]] | ||
Строка 27: | Строка 33: | ||
| | | | ||
| Г.-В. Вебер | | Г.-В. Вебер | ||
+ | | Идут переговоры об открытии данных | ||
+ | |- | ||
+ | | [[Макроэкономическое моделирование и модели принятия решений (пример)]] | ||
+ | | | ||
+ | | | ||
+ | | В.В. Стрижов | ||
+ | | Данные есть | ||
+ | |- | ||
+ | | [[Прогнозирование концентрации кислорода в выхлопных газах дизельного двигателя (пример)]] | ||
+ | | | ||
+ | | | ||
+ | | В.В. Стрижов | ||
+ | | Данные будут | ||
+ | |- | ||
+ | | [[Оценка эффективности природоохранных программ (пример)]] | ||
+ | | | ||
| | | | ||
+ | | В.В. Стрижов (П. Летмате?) | ||
+ | | Данных пока нет (в евр. комм. по энергетике, но неясно, какие использовать) | ||
|- | |- | ||
|} | |} | ||
Строка 46: | Строка 70: | ||
* a.1.1.1 -- классификатор белка, иерархическая структура разделена точками, | * a.1.1.1 -- классификатор белка, иерархическая структура разделена точками, | ||
* slfaklggreavea... -- последовательность аминокислот (без пробелов и переносов до символа >). | * slfaklggreavea... -- последовательность аминокислот (без пробелов и переносов до символа >). | ||
+ | |||
+ | |||
+ | === [[Поиск нелинейной модели поверхности Мохоровичича (пример)]] === | ||
+ | Черновик. Исследуется проблема разделения наблюденного (измеренного) поля силы тяжести на две компоненты. | ||
+ | Одна должна отражать влияние границы разделяющая земную кору и мантию Земли (так называемая поверхность Мохоровичича или просто Мохо), а вторая собственно влияние самой земной коры. Специалистов, которые занимались и занимаются уточнением глубины до поверхности Мохо и проблемой ИЗОСТАЗИИ много, выполненных сейсмических работ по данной тематике (Глубинные сеймические зондирования ГСЗ) тоже много, опубликованных работ еще больше. | ||
+ | Если бы эталоная выборка по данным ГСЗ была хорошей (равноточной и равномерной по площади) тогда построить глубину до Мохо <tex>H=f(x,y)</tex> по экспериментальным данным с некоторой детальностью (естественно не выше некоторых пространственных частот) проблемы в целом не составляет. Задача состоит в детализации <tex>H=f(x,y)</tex> используя поле силы тяжести <tex>G</tex> измеренное с большей детальностью чем эталонная выборка. И тогда надо построить <tex>H=f(x,y,G(x,y))</tex>. Само поле силы тяжести осложнено влиянием аномалий поля силы тяжести от некоторого количества известных и неизвестных изолированных объектов <tex>A_i</tex>, и от влияния некоторого количества границ раздела <tex>Г_i</tex>. Тогда все превращается в | ||
+ | <tex>H=f(x,y,G(x,y,A_i,Г_i))</tex>. | ||
+ | |||
+ | В дополнение ко всему может так получиться, что для некоторых ограниченных областей, несмотря на наши расчеты и полученные зависимости глубины <tex>Н</tex> из геологических данных могут быть такими и только такими, т.е. модели в таких областях будут отличны. | ||
== Экзамен == | == Экзамен == |
Версия 15:12, 30 июня 2010
- Численные методы обучения по прецедентам (программа курса)
- Автоматизация и стандартизация научных исследований (программа курса)
Содержание |
Задачи
Название задачи | Работу выполняет | Работу рецензируют | Задачу предложил | Комментарии |
---|---|---|---|---|
Прогнозирование класса третичной структуры белка по первичной (пример) | И.Ю. Торшин | Данные открыты | ||
Поиск нелинейной модели поверхности Мохоровичича (пример) | С.Н. Агеев | Данные будут подготовлены, открытость обсудим | ||
Долгосрочное прогнозирование ежедневных цен на электроэнергию (пример) | М. Хильдман | Данные есть | ||
Краткосрочное прогнозирование почасовых цен на электроэнергию (пример) | Г.-В. Вебер | Идут переговоры об открытии данных | ||
Макроэкономическое моделирование и модели принятия решений (пример) | В.В. Стрижов | Данные есть | ||
Прогнозирование концентрации кислорода в выхлопных газах дизельного двигателя (пример) | В.В. Стрижов | Данные будут | ||
Оценка эффективности природоохранных программ (пример) | В.В. Стрижов (П. Летмате?) | Данных пока нет (в евр. комм. по энергетике, но неясно, какие использовать) |
Прогнозирование класса третичной структуры белка по первичной (пример)
Требуется предложить алгоритм порождения признаков для восстановления регресии. При выборе признаков класс моделей (RBF, обсуждается) и метод выбора (метод моделей наибольшего правдоподобия) будут фиксированы.
Предлагается использовать базу данных "ASTRAL SCOP Genetic Domain Sequences 1.75"[1], архив PDB SEQRES records: astral-scopdom-seqres-gd-all-1.75.fa[2]
Структура данных
>d1dlya_ a.1.1.1 (A:) Protozoan/bacterial hemoglobin {Green alga (Chlamydomonas eugametos) [TaxId: 3054]} slfaklggreaveaavdkfynkivadptvstyfsntdmkvqrskqfaflayalggasewk gkdmrtahkdlvphlsdvhfqavarhlsdtltelgvppeditdamavvastrtevlnmpq
- d1dlya_ -- идентификатор эксперимента (код файла в PDB),
- a.1.1.1 -- классификатор белка, иерархическая структура разделена точками,
- slfaklggreavea... -- последовательность аминокислот (без пробелов и переносов до символа >).
Поиск нелинейной модели поверхности Мохоровичича (пример)
Черновик. Исследуется проблема разделения наблюденного (измеренного) поля силы тяжести на две компоненты. Одна должна отражать влияние границы разделяющая земную кору и мантию Земли (так называемая поверхность Мохоровичича или просто Мохо), а вторая собственно влияние самой земной коры. Специалистов, которые занимались и занимаются уточнением глубины до поверхности Мохо и проблемой ИЗОСТАЗИИ много, выполненных сейсмических работ по данной тематике (Глубинные сеймические зондирования ГСЗ) тоже много, опубликованных работ еще больше. Если бы эталоная выборка по данным ГСЗ была хорошей (равноточной и равномерной по площади) тогда построить глубину до Мохо по экспериментальным данным с некоторой детальностью (естественно не выше некоторых пространственных частот) проблемы в целом не составляет. Задача состоит в детализации используя поле силы тяжести измеренное с большей детальностью чем эталонная выборка. И тогда надо построить . Само поле силы тяжести осложнено влиянием аномалий поля силы тяжести от некоторого количества известных и неизвестных изолированных объектов , и от влияния некоторого количества границ раздела . Тогда все превращается в .
В дополнение ко всему может так получиться, что для некоторых ограниченных областей, несмотря на наши расчеты и полученные зависимости глубины из геологических данных могут быть такими и только такими, т.е. модели в таких областях будут отличны.
Экзамен
Пока не назначен