Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 274, осень 2015
Материал из MachineLearning.
(Различия между версиями)
(→Задача 2) |
м |
||
Строка 1: | Строка 1: | ||
{{Main|Численные методы обучения по прецедентам (практика, В.В. Стрижов)}} | {{Main|Численные методы обучения по прецедентам (практика, В.В. Стрижов)}} | ||
- | Короткая ссылка на эту страницу: http://goo.gl/7wpPlp | + | |
+ | |||
+ | == Курс == | ||
+ | '''Построение эксплуатируемых моделей и проведение вычислительного эксперимента''' | ||
+ | '''Результаты предыдущих курсов''' | ||
+ | * [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 174, осень 2014 | Группа 174, осень 2014: построение эксплуатируемых моделей и проведение вычислительного эксперимента, задачи из индустриальных и академических источников]] | ||
+ | * [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 074, осень 2013 | Группа 074, осень 2013: построение эксплуатируемых моделей и проведение вычислительного эксперимента]] | ||
+ | * Короткая ссылка на эту страницу: http://goo.gl/7wpPlp | ||
+ | |||
+ | Проекты с готовой Web-частью располагаются по адресу http://mvr.jmlda.org | ||
{|class="wikitable" | {|class="wikitable" |
Версия 10:49, 3 сентября 2015
Курс
Построение эксплуатируемых моделей и проведение вычислительного эксперимента Результаты предыдущих курсов
- Группа 174, осень 2014: построение эксплуатируемых моделей и проведение вычислительного эксперимента, задачи из индустриальных и академических источников
- Группа 074, осень 2013: построение эксплуатируемых моделей и проведение вычислительного эксперимента
- Короткая ссылка на эту страницу: http://goo.gl/7wpPlp
Проекты с готовой Web-частью располагаются по адресу http://mvr.jmlda.org
Автор | Тема научной работы | Ссылка | Консультант | Рецензент | Доклады | Буквы | Сумма | Оценка |
---|---|---|---|---|---|---|---|---|
Бернштейн Юлия | ||||||||
Бочкарев Артем | ||||||||
Гончаров Алексей | ||||||||
Двинских Дарина | ||||||||
Ефимов Юрий | ||||||||
Жариков Илья | ||||||||
Задаянчук Андрей | ||||||||
Златов Александр | ||||||||
Исаченко Роман | ||||||||
Нейчев Радослав | ||||||||
Подкопаев Александр | ||||||||
Решетова Дарья | ||||||||
Смирнов Евгений | ||||||||
Соломатин Иван | ||||||||
Черных Владимир | ||||||||
Шишковец Светлана | ||||||||
Камзолов Дмитрий |
Задачи
Шаблон описания научной статьи
- Название: Название, под которым статья подается в журнал.
- Задача: Описание или постановка задачи. Желательна постановка в виде задачи оптимизации (в формате argmin). Также возможна ссылка на классическую постановку задачи.
- Данные: Краткое описание данных, используемых в вычислительном эксперименте, и ссылка на выборку.
- Литература: Список научных работ, дополненный 1) формулировкой решаемой задачи, 2) ссылками на новые результаты, 3) основной информацией об исследуемой проблеме.
- Базовой алгоритм: Ссылка на алгоритм, с которым проводится сравнение или на ближайшую по теме работу.
- Решение: Предлагаемое решение задачи и способы проведения исследования. Способы представления и визуализации данных и проведения анализа ошибок, анализа качества алгоритма.
- Новизна: Обоснование новизны и значимости идей (для редколлегии и рецензентов журнала).
Список проектов
Задача 1
- Название: Анализ данных для выявления скрытых закономерностей в петрофизической информации, полученной лабораторными исследованиями керна
- Задача: Имеются результаты измерений параметров керна скважины в некотором интервале по глубине, содержащим породу с газовой и нефтяной частями. Измерения имеют типичную лабораторную погрешность и возможные отскоки. Часть данных продублирована измерениями другой лаборатории. Требуется отсеять недостоверные данные, оценить достоверность отобранных данных, выявить подмножества определяющих параметров, с оценкой дисперсий. Построение соответствующих методов, учитывающих физику данных и типы пород, является составной частью задачи.
- Данные: таблица с данными измерений керна по глубине, содержащими теплофизические свойства, плотность, пористость и проницаемость породы. Возможно добавление аналогичных таблиц с другими глубинами и/или скважинами.
- Литература:
- У консультанта имеются полезные учебники по основам лабораторных исследований керна и свойствам пород (djvu)
- Математический инструментарий ожидается от научного руководителя
- Литературный обзор применяемых в нефтянке методик (см. следующий пункт) предлагается выполнить студенту самостоятельно, как одну из целей проекта.
- Базовой алгоритм: Необходимо предварительное литературное исследование имеющихся в нефтегазовой науке методик с целью выявления их возможностей, сильных и слабых сторон. Ожидается либо усовершенствование известных подходов, либо успешное применение некоторого нового алгоритма.
- Решение: ??
- Новизна: Информационное обеспечение разведки и разработки нефтяных и газовых месторождений содержит большие массивы данных, включающих случайную и систематическую составляющую. Для задач интерпретации и прогноза необходима, как первая цель, общая математическая методика, позволяющая выявить систематическую составляющую вместе с оценкой достоверности и статистическими параметрами вклада случайной составляющей. Следующей, и основной целью, является разработка непосредственно самих методов интерпретации отфильтрованных достоверных данных и оценки коллекторских свойств продуктивных пластов (пористости, проницаемости, начальной нефтенасыщенности).
- Консультант: И.Л. Софронов, Московский научно-исследовательский центр Шлюмберже.
Задача 2
- Название: Определение области обоснованности регрессионной модели
- Задача: Для молекул строятся регрессионные модели, которые по описанию молекулы предсказывают ее свойства (свободная энергия и т.д.). Нужно построить классификатор, который будет оценивать насколько стоит доверять предсказанным свойствам для новой молекулы: ошибается ли модель более чем на 30% (относительная ошибка) в оценке свободной энергии молекулы.
- Данные: открытые данные с PubMed и других источников, явные ссылки на источники есть у консультанта.
- Литература:
- У консультанта имеются статьи, в которых рассматриваются похожие задачи в хемоинформатике.
- Существует хорошая книга по регрессии на основе гауссовских процессов http://www.gaussianprocess.org/gpml/
- Базовой алгоритм: Предполагается, что для построения регрессионной модели будет использоваться алгоритм построения регрессионной модели на основе гауссовских процессов. В качестве дополнительного признака для классификации качества модели в точке можно использовать оценку неопределенности модели (апостериорную дисперсию).
- Решение: ??
- Новизна: Предполагается, что использование оценок неопределенности модели позволит улучшить классификацию точек на те, на которых модель достаточно точна и не очень точна. Предполагается, что студент предложит самостоятельно и другие признаки и оценит их полезность на практике.
- Консультант: А.А. Зайцев, ИППИ РАН.