Автоматизация научных исследований в машинном обучении (практика, В.В. Стрижов)/Группа 694, весна 2019

Материал из MachineLearning.

Перейти к: навигация, поиск

Основная статья: Численные методы обучения по прецедентам (практика, В.В. Стрижов)

Видео докладов по курсу на канале Machine Learning на Youtube

Моя первая научная публикация

Участвуют эксперты, индивидуальные консультанты и студенты кафедры Интеллектуальные системы ФУПМ МФТИ.

Описание курса
История 2019 (674) — 2018 — 2017 — 2016 — 2015 — 2014 — 2013
Видео докладов по курсу на канале Machine Learning на Youtube
Короткая ссылка на эту страницу: http://bit.ly/M1_2019_694

Роли

Студент третьего курса очень хочет научиться ставить задачи формально, находить нужную литературу, порождать новые и актуальные идеи и решения задач.

Консультант помогает студенту в пользовании инструментами, отвечает на вопросы по специальности, консультирует выполнение работ, оперативно реагирует на проблемы, проверяет (в среду) результаты, ставит оценки. Предполагается, что консультант сам пишет работу-спутник по этой теме. В конце работы могут быть объединены или выполнены и опубликованы параллельно. По возможности, рекомендуется организовать правки текста студента с целью улучшить стиль изложения таким образом, чтобы студент вносил правки самостоятельно. Возможно, при очной встрече или по скайпу.

Эксперт: поставщик задачи, владелец данных, либо тот, кто гарантирует новизну и актуальность работы.

Результаты

Автор	Тема научной работы	Ссылки	Консультант	Рецензент
Вишнякова Нина	Optimal Approximation of Non-linear Power Flow Problem	LinkReview paper code presentation video	Yury Maximov	рецензент Логинов Роман review
Кудрявцева Полина	Прогнозирование намерений. Построение оптимальной модели декодирования сигналов при моделировании нейрокомпьютерного интерфейса.	code LinkReview paper video presentation	Роман Исаченко	Нечепуренко Иван review
Логинов Роман	Мультимоделирование как универсальный способ описания выборки общего вида	code LinkReview paper ChatInvite presentation video	Адуенко А. А.	Макаров Михаил review
Михаил Макаров	Определение местоположения по сигналам акселерометра	code LinkReview paper презентация video	Анастасия Мотренко	Черепков Антон: review
Козинов Алексей	Задача поиска символов в изображениях	LinkReview paper code	М. Апишев, Д. Лемтюжникова	Грачёва Анастасия (рецензия)
Бучнев Валентин	Раннее прогнозирование достаточного объема выборки для обобщенной линейной модели.	LinkReview paper code presentation video	Грабовой А. В.	рецензент
Нечепуренко Иван	Мультимоделирование, привилегированное обучение	code, paper, LinkReview презентация	Р. Г. Нейчев	Кудрявцева Полина
Грачева Анастасия	Оценка энергии связывания белка и маленьких молекул	code paper LinkReview presentation video	Сергей Грудинин, Мария Кадукова	рецензент
Черепков Антон	Привилегированное обучение в задаче аппроксимации границ радужки глаза	paper, slides, code, LinkReview video	Р. Г. Нейчев	Лепехин Михаил preliminary review
Лепехин Михаил	Создание ранжирующих моделей для систем информационного поиска. Алгоритм прогнозирования структуры локально-оптимальных моделей	code LinkReview paper presentation video	Андрей Кулунчаков	Вишнякова Нина, рецензия
Гридасов Илья	Автоматическое построение нейросети оптимальной сложности	LinkReview paper Presentation code	О. Ю. Бахтеев, В. В. Стрижов	Бучнев Валентин
Теленков Дмитрий	Декодирование сигналов мозга и прогнозирование намерений	LinkReview git The paper Presentation code	Андрей Задаянчук	рецензент

Расписание

Дата		N	Что делаем	Результат для обсуждения	Буква
Февраль	14	1	Организация работы, расписание, инструменты.	Инструменты подготовлены к работе.	(Анкета)
	21	2	ДЗ-1. Выбор задачи	Тема в ML и ссылка на работу в SF помещена напротив фамилии.	(Анкета)
	28	3	Составить список публикаций по выбранной задаче, найти данные. Написать аннотацию и введение с обзором собранной литературы.	Аннотация (600 знаков), введение (1 страница), список литературы в bib-файле. Подготовить доклад 45 сек.	Abstract, Introduction, Literature, B*-talk (Анкета)
Март	7	4	Поставить задачу и сделать описание базового алгоритма, подготовить базовый вычислительный эксперимент.	Постановка задачи (0.5-1 страница), описание базового алгоритма.	Statement (Анкета)
	14	5	Поставить базовый вычислительный эксперимент. Провести первичный анализ работы алгоритма. Показ статьи.	Базовый код, отчет о работе базового алгоритма (кратко).	Basic code, Report, cHeck-1
	21	6	Поставить вычислительный эксперимент на основе предлагаемого алгоритма с учетом предыдущих результатов.	Код, визуализация полученных результатов, анализ ошибки, анализ качества. Подготовить промежуточный доклад со слайдами, 2-3 минуты.	M-talk, Code, Visualization
	28	7	Описать алгоритм.	Теоретическая и алгоритмическая часть статьи (второй / третий раздел).	Theory
Апрель	4	8	Завершение вычислительного эксперимента.	Описание эксперимента с анализом ошибок.	Error
	11	9	Описание теоретической части и вычислительного эксперимента. Описание рисунков, выводы, заключение.	Черновой вариант статьи с разделами «Вычислительный экперимент» и «Заключение».	Document
	18	10	Контрольная точка — показ статьи в целом, рецензия.	Статья в варианте для рецензирования.	сHeck-2, RevieW
	25	11	Подготовка презентации.	Доклады и обсуждение.	Final show, Slides
Май	16	12	Доработка статьи.	Статья подготовлена к подаче в журнал.	Journal

Список проектов

Шаблон описания проекта — научной статьи

Название: Название, под которым статья подается в журнал.
Задача: Описание или постановка задачи. Желательна постановка в виде задачи оптимизации (в формате argmin). Также возможна ссылка на классическую постановку задачи.
Данные: Краткое описание данных, используемых в вычислительном эксперименте, и ссылка на выборку.
Литература: Список научных работ, дополненный 1) формулировкой решаемой задачи, 2) ссылками на новые результаты, 3) основной информацией об исследуемой проблеме.
Базовой алгоритм: Ссылка на алгоритм, с которым проводится сравнение или на ближайшую по теме работу.
Решение: Предлагаемое решение задачи и способы проведения исследования. Способы представления и визуализации данных и проведения анализа ошибок, анализа качества алгоритма.
Новизна: Обоснование новизны и значимости идей (для редколлегии и рецензентов журнала).
Авторы: эксперт, консультант.

Задача 18

Название: Прогнозирование намерений. Построение оптимальной модели декодирования сигналов при моделировании нейрокомпьютерного интерфейса.
Задача: Нейрокомпьютерный интерфейс (BCI) позволяет помочь людям с ограниченными возможностями вернуть их мобильность. По имеющемуся описанию сигнала прибора необходимо смоделировать поведение субъекта.
Данные: Наборы данных сигналов мозга ECoG/EEG.
Литература:

- Motrenko A.P., Strijov V.V. Multi-way feature selection for ECoG-based brain-computer Interface // Expert systems with applications. - 2018.

Базовый алгоритм: Сравнение предлагается производить с алгоритмом частных наименьших квадратов (partial least squares).
Решение: В данной работе предлагается построить единую систему, решающую задачу декодирования сигналов. В качестве этапов построения такой системы предлагается решить задачи предобработки данных, выделения признакового пространства, снижения размерности и выбора модели оптимальной сложности. Предлагается использовать тензорный вариант PLS с отбором признаков.
Новизна: В постановке задачи учитывается комплексная природа сигнала: непрерывная траектория движения, наличие дискретных структурных переменных (пальцы или движение суставов), наличие непрерывных переменных (позиция пальца или конечности).
Авторы: В.В. Стрижов, Tetiana Aksenova, консультант – Роман Исаченко

Задача 41

Название: Optimal Approximation of Non-linear Power Flow Problem
Задача: Our goal is to approximate the solution of non-linear non-convex optimal power flow problem by solving a sequence of convex optimization problems (aka trust region approach). On this way we propose to compare various approaches for approximate solution of this problem with adaptive approximation of the power flow non-linearities with a sequence of quadratic and/or piece-wise linear functions
Данные: Matpower module from MATLAB contains all necessary test cases. Start considering with IEEE 57 bus case.
Литература:
1. Molzahn, D. K., & Hiskens, I. A. (2019). A survey of relaxations and approximations of the power flow equations. Foundations and Trends in Electric Energy Systems, 4(1-2), 1-221. https://www.nowpublishers.com/article/DownloadSummary/EES-012
2. The QC Relaxation: A Theoretical and Computational Study on Optimal Power Flow. Carleton Coffrin ; Hassan L. Hijazi ; Pascal Van Hentenryck https://ieeexplore.ieee.org/abstract/document/7271127/
3. Convex Relaxations in Power System Optimization: A Brief Introduction. Carleton Coffrin and Line Roald. https://arxiv.org/pdf/1807.07227.pdf
4. Optimal Adaptive Linearizations of the AC Power Flow Equations. Sidhant Misra, Daniel K. Molzahn, and Krishnamurthy Dvijotham https://molzahn.github.io/pubs/misra_molzahn_dvijotham-adaptive_linearizations2018.pdf
Базовой алгоритм: A set of algorithms described in [1] should be considered to compare with, details behind the proposed method would be shared by the consultant (a draft of the paper)
Решение: to figure out the quality of the solution we propose to compare it with the ones given by IPOPT and numerous relaxations, and do some reverse engineering regarding to our method
Новизна: The OPF is a truly hot topic in power systems, and is of higher interest by the discrete optimization community (as a general QCQP problem). Any advance in this area is of higher interest by the community
Авторы: Yury Maximov (consultant and expert), Michael Chertkov (expert)
Замечания: the problem has both the computational and the theoretical focuses, so 2 students are ok to work on this topic

Задача 4

Название: Автоматическая настройка параметров АРТМ под широкий класс задач.
Задача: Открытая библиотека bigARTM позволяет строить тематические модели, используя широкий класс возможных регуляризаторов. Однако такая гибкость приводит к тому, что задача настройки коэффициентов оказывается очень сложной. Эту настройку можно значительно упростить, используя механизм относительных коэффициентов регуляризации и автоматический выбор N-грамм. Нужно проверить гипотезу о том, что существует универсальный набор относительных коэффициентов регуляризации, дающий "достаточно хорошие" результаты на широком классе задач. Дано несколько датасетов с каким-то внешним критерием качества (например, классификация документов по категориям или ранжирование). Находим лучшие параметры для конкретного датасета, дающие "локально лучшую модель". Находим алгоритм инициализации bigARTM, производящий тематические модели с качеством, сравнимым с "локально лучшей моделью" на её датасете. Критерий сравнимости по качеству: на данном датасете качество "универсальной модели" не более чем на 5% хуже, чем у "локально лучшей модели".
Данные: Victorian Era Authorship Attribution Data Set, 20 Newsgroups, МКБ-10, триплеты для поиска/ранжирования.
Литература:
1. ВКР Никиты Дойкова: http://www.machinelearning.ru/wiki/images/9/9f/2015_417_DoykovNV.pdf
2. Презентация Виктора Булатова на научном семинаре: https://drive.google.com/file/d/19pJ21LRPeeOxY4mkcSnQCRm93zOO4J5b/view
3. Черновик с формулами: https://drive.google.com/open?id=1AqS7snUsSJ18ZYBtC-6uP_2dMTDJSGeD
Базовый алгоритм: PLSA / LDA / логрегрессия.
Решение: bigARTM с фоновыми темами и регуляризаторами сглаживания, разреживания и декорреляции (коэффициенты подобраны автоматически), а также с автоматически выделенными N-граммами.
Новизна: Потребность в автоматизированной настройке параметров модели и отсутствие подобных реализаций в научном сообществе.
Авторы: консультант Виктор Булатов, эксперт К.В. Воронцов.

Задача 2

Название: Исследование опорных объектов в задаче метрической классификации временных рядов.
Задача: Функция DTW - это расстояние между двумя временными рядами, которые могут быть нелинейно деформированы друг относительно друга. Она ищет наилучшее выравнивание между двумя объектами, поэтому ее можно использовать в задаче метрической классификации объектов. Один из методов решения задачи метрической классификации - измерение расстояний до опорных объектов и использование вектора этих расстояний в качестве признакового описания объекта. Метод DBA - это алгоритм построения центроидов (опорных объектов) для временных рядов на основе расстояния DTW. При построении расстояния между временным рядом и центроидом различные пары значений (например пиковые значения) более характерны для одного из классов, и влияние таких совпадений на значение расстояния должна быть выше.

Необходимо исследовать различные способы построения опорных объектов, а также определение их оптимального числа. Критерием является качество работы метрического классификатора в задаче. В методе DBA для каждого центроида предлагается создавать вектор весов, который демонстрирует "значимость" измерений центроида, и использовать его в модифицированной функции расстояния weighted-DTW.

Данные: Данные описывают 6 классов временных рядов с акселерометра мобильного телефона. https://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group274/Goncharov2015MetricClassification/data/
Литература:
Базовый алгоритм: Реализовать базовые методы:
1. Выбор подмножества объектов обучающей выборки как опорных
2. Предварительная обработка аномальных объектов
3. Кластеризация объектов обучающей выборки для построения центроидов внутри кластера
4. Использование метода DBA для построения опорных объектов
5. Использование методов численной оптимизации для поиска оптимального вектора весов с заданными ограничениями
Решение: Расширение типов ограничений на вид вектора весов: бинарный вектор, одинаковый вектор для всех центроидов, бинарный одинаковый вектор для всех центроидов. Такое решение позволит экономить затраты энергии при работе датчиков мобильного устройства.

Исследование литературы и комбинация up-to-date методов.

Новизна: Не проводилось комплексного исследования различных способов построения центроидов и опорных элементов вместе с выбором их оптимального числа.
Авторы: Алексей Гончаров - консультант, эксперт, В.В. Стрижов - эксперт

Задача 7

Название: Привилегированное обучение в задаче аппроксимации границ радужки глаза
Задача: По изображению человеческого глаза определить окружности, аппроксимирующие внутреннюю и внешнюю границу радужки.
Данные: Растровые монохромные изображения, типичный размер 640*480 пикселей (однако, возможны и другие размеры)[1], [2].
Литература:
- Адуенко А.А. Выбор мультимоделей в задачах классификации (научный руководитель В.В. Стрижов). Московский физико-технический институт, 2017. [3]
- К.А.Ганькин, А.Н.Гнеушев, И.А.Матвеев Сегментация изображения радужки глаза, основанная на приближенных методах с последующими уточнениями // Известия РАН. Теория и системы управления, 2014, № 2, с. 78–92.
- Duda, R. O. Use of the Hough transformation to detect lines and curves in pictures / R. O. Duda, P. E. Hart // Communications of the ACM. 1972. Vol. 15, no. 1. Pp.
Базовый алгоритм: Ефимов Юрий. Поиск внешней и внутренней границ радужки на изображении глаза методом парных градиентов, 2015.
Решение: См. Iris_circle_problem.pdf
Новизна: Предложен быстрый беспереборный алгоритм аппроксимации границ с помощью линейных мультимоделей. Дополнительно капсульные нейросети.
Консультант: Радослав Нейчев (автор Стрижов В.В., эксперт Матвеев И.А.)

Задача 44

Название: Ранее прогнозирование достаточного объема выборки для обобщенно линейной модели.
Задача: Исследуется проблема планирования эксперимента. Решается задача оценивания достаточного объема выборки по данным. Предполагается, что выборка является простой. Она описывается адекватной моделью. Иначе, выборка порождается фиксированной вероятностной моделью из известного класса моделей. Объем выборки считается достаточным, если модель восстанавливается с достаточной достоверностью. Требуется, зная модель, оценить достаточный объем выборки на ранних этапах сбора данных.
Данные: Для вычислительного эксперимента предлагается использовать классические выборки из UCI репозитория. Ссылка на выборки https://github.com/ttgadaev/SampleSize/tree/master/datasets
Литература:
1. [Обзор методов для оценки объема выборки]
2. http://svn.code.sf.net/p/mlalgorithms/code/PhDThesis/..
3. Метод бутстреп. https://projecteuclid.org/download/pdf_1/euclid.aos/1..

Bishop, C. 2006. Pattern Recognition and Machine Learning. Berlin: Springer. 758 p.

Базовый алгоритм: Будем говорить, что объем выборки достаточный, если логарифм правдоподобия имеет малую дисперсию, на подборке размера m, посчитанную при помощи бутстрепа.

Пытаемся аппроксимировать зависимость среднего значения log-likelihood и его дисперсии от размера выборки.

Решение: Методы описанные в обзоре являются асимптотическими или же требуют заведомо большого размера выборки. Новый метод должен заключаться в том, чтобы прогнозировать объем на начальных этапах планирования эксперимента, то есть когда данных мало.
Авторы: Грабовой А. В. (консультант), Гадаев Т. Т Стрижов В. В. (эксперты)
Примечание: для определения простоты выборки предлагается новое определение сложности (Сергей Иванычев). Это отдельная работа, +1 задача 44a (? Катруца).

Задача 15

Название: Формулировка и решение задачи оптимизации, сочетающей классификацию и регрессию, для оценки энергии связывания белка и маленьких молекул. Описание задачи [4]
Задача: С точки зрения биоинформатики, задача заключается в оценке свободной энергии связывания белка с маленькой молекулой (лигандом): наилучший лиганд в своем наилучшем положении имеет наименьшую свободную энергию взаимодействия с белком. (Далее большой текст, см. файл по ссылке вверху.)
Данные:
- Данные для бинарной классификации. Около 12,000 комплексов белков с лигандами: для каждого из них есть 1 нативная поза и 18 ненативных. Основными дескрипторами являются гистограммы распределений расстояний между различными атомами белка и лиганда, размерность вектора дескрипторов ~ 20,000. В случае продолжения исследования и публикации в профильном журнале набор дескрипторов может быть расширен. Данные будут предоставлены в виде бинарных файлов со скриптом на python для чтения.
- Данные для регрессии. Для каждого из представленных комплексов известно значение величины, которую можно интерпретировать как энергию связывания.
Литература:
- SVM [5]
- Ridge Regression [6]
- [7] (секция 1)
Базовый алгоритм: [8] В задаче классификации мы использовали алгоритм, похожий на линейный SVM, связь которого с оценкой энергии, выходящей за рамки задачи классификации, описана в указанной выше статье. В задаче регрессии можно использовать различные функции потерь.
Решение: Необходимо связать использованную ранее оптимизационную задачу с задачей регрессии и решить стандартными методами. Для проверки работы алгоритма будет использована кросс-валидация. Есть отдельный тестовый сет, состоящий из (1) 195 комплексов белков и лигандов, для которых нужно найти наилучшую позу лиганда (алгоритм получения положений лиганда отличается от используемого при обучении), (2) комплексов белков и лигандов, для нативных поз которых нужно предсказать энергию связывания, и (3) 65 белков, для которых нужно найти наиболее сильно связывающийся лиганд.
Новизна: В первую очередь, интерес представляет объединение задач классификации и регрессии. Правильная оценка качества связывания белка и лиганда используется при разработке лекарства для поиска молекул, наиболее сильно взаимодействующих с исследуемым белком. Использование описанной выше задачи классификации для предсказания энергии связывания приводит к недостаточно высокой корреляции предсказаний с экспериментальными значениями, в то время как использование одной лишь задачи регрессии приводит к переобучению.
Авторы Сергей Грудинин, Мария Кадукова

Задача 27

Название: Создание ранжирующих моделей для систем информационного поиска. Алгоритм прогнозирования структуры локально-оптимальных моделей
Задача: Требуется спрогнозировать временной ряд с помощью некоторой параметрической суперпозицией алгебраических функций. Предлагается не стоить прогностическую модель, а спрогнозировать ее, то есть предсказать структуру аппроксимирующей суперпозиции. Вводится класс рассматриваемых суперпозиций, и на множестве таких структурных описаний проводится поиск локально-оптимальной модели для рассматриваемой задачи. Задача состоит в 1) поиске подходящего структурного описания модели 2) описания алгоритма поиска той структуры, которая будет соответствовать оптимальной модели 3) описания алгоритма обратного построения модели по ее структурному описанию. В качестве уже имеющегося примера ответа на вопросы 1-3, смотри работы А. А. Варфоломеевой.
Данные:
- Коллекция текстовых документов TREC (!)
- Набор временных рядов, который подразумевает восстановление функциональных зависимостей. Предлагается сначала использовать синтетические данные или сразу применить алгоритм к прогнозированию временных рядов 1) потребления электроэнергии 2) физической активности с последующим анализом получающихся структур.
Литература:
1. (!) Kulunchakov A.S., Strijov V.V. Generation of simple structured Information Retrieval functions by genetic algorithm without stagnation // Expert Systems with Applications, 2017, 85 : 221—230.
2. А. А. Варфоломеева Выбор признаков при разметке библиографических списков методами структурного обучения, 2013, [9]
3. Bin Cao, Ying Li and Jianwei Yin Measuring Similarity between Graphs Based on the Levenshtein Distance, 2012, [10]
Базовой алгоритм: Описан в [1]. Развит в работе команды группы 974. Предлагается использовать их код и эксперимент.
Решение: Предлагается попробовать повторить эксперимент А. А. Варфоломеевой для другого структурного описания, чтобы понять, что происходит. Суперпозиция алгебраических функций задает ордерево, на вершинах которого заданы метки соответствующих алгебраических функций или переменных. Поэтому структурным описанием такой суперпозиции может являться ее DFS-code. Это строка, состоящая из меток вершин, записанных в порядке обхода дерева поиском в глубину. Зная арности соответствующих алгебраических функций, можем любой такой DFS-code восстановить за O(n) и получить обратно суперпозицию функций. На множестве подобных строковых описаний предлагается искать то строковое описание, которое будет соответствовать оптимальной модели.
Авторы: консультант Андрей Кулунчаков (Inria Montbonnot), эксперт В. В. Стрижов

Задача 26

Название: Определение местоположения по сигналам акселерометра
Задача: Даны исходные координаты, сигналы акселерометра, дополнительная информация (сигналы гироскопа, магнетометра). Возможно, дана неточная карта (задача SLAM)
Данные: из работы [1], данные, собранные самостоятельно.
Литература:
1. https://arxiv.org/pdf/1712.09004.pdf
2. https://ieeexplore.ieee.org/document/1528431
Базовый алгоритм: из работы [1].
Решение: Поиск априорной и дополнительной информации, которая позволяет повысить точность позиционирования.
Новизна: Постановка задачи в терминах Projection to Latent Spaces
Авторы: консультант Анастасия Мотренко, эксперт Илья Гарцеев, В. В. Стрижов

Задача 45

Название: Задача поиска символов в изображениях
Задача: Данная задача в одном из вариантов постановки может быть сведена к двум последовательным операциям: 1) поиск объектов на изображении и определение их класса 2) поиск в базе данных информации о символическом смысле найденных объектов. Основная сложность решения задачи заключена в поиске объектов на изображении. Однако следующая классификация также может быть затруднительной в связи с тем, что изображение объекта может быть неполным, необычно стилизованным и т.п.
Данные: Словарь символов  Сайты-музеи  Image-net 
Литература:
1. http://www.machinelearning.ru/wiki/images/e/e2/IDP18.pdf (с. 116)
2. http://www.image-net.org
Базовый алгоритм: CNN
Решение: Предлагается сравнить работы нескольких state-of-the-art алгоритмов. Предложить метрику качества поиска и классификации объектов. Определить применимость методов.
Новизна: Предлагаемый подход к анализу изображений используется экспертами в ручном режиме и не был автоматизирован
Авторы: М. Апишев (консультант), Д. Лемтюжникова

Задача 28

Название: Мультимоделирование как универсальный способ описания выборки общего вида
Задача: Построить метод инкрементального уточнения структуры мультимодели при появлении новых объектов. Разработка и сравнение разных алгоритмов обновления структуры мультимоделей. Построение оптимальной схемы уточнения структуры мультимодели в зависимости от полного размера выборки.
Данные: На начальном этапе работы используются синтетические данные с известной статистической структурой. Тестирование разработанных методов производится на реальных данных из репозитория UCI.
Литература:

Bishop, Christopher M. «Pattern recognition and machine learning». Springer, New York (2006).
Gelman, Andrew, et al. Bayesian data analysis, 3rd edition. Chapman and Hall/CRC, 2013.
MacKay, David JC. «The evidence framework applied to classification networks.» Neural computation 4.5 (1992): 720—736.
Адуенко А. А. «Выбор мультимоделей в задачах классификации» кандидатская диссертация
Motrenko, Anastasiya, Vadim Strijov, and Gerhard-Wilhelm Weber. «Sample size determination for logistic regression.» Journal of Computational and Applied Mathematics 255 (2014): 743—752.

Базовой алгоритм: Алгоритм построения адекватных мультимоделей из #4.
Решение: Байесовский подход к задаче выбора моделей на основании обоснованности. Анализ свойств обоснованности и ее связи со статистической значимостью.
Новизна: Предлагается метод построения оптимальной схемы обновления структуры мультимодели при появлении новых объектов. Исследована связь обоснованности и статистической значимости для некоторых классов моделей.
Авторы: Стрижов Вадим Викторович, Адуенко Александр Александрович (GMT-5)

Задача 11

Название: Автоматическое построение нейросети оптимальной сложности
Задача: Рассматривается задача нахождения устойчивой (и не избыточной по параметрам) структуры нейросети. Нейросеть рассматривается как вычислительный граф, ребрами которого выступают примитивные функции, а вершинами --- промежуточные представления выборки, полученные под действием этих функций. Требуется выбрать подграф модели, при котором итоговая нейросеть будет давать приемлемое качество классификации при небольшом количестве параметров.
Данные: Выборки Boston, MNIST, CIFAR-10
Литература:
1. Бахтеев О.Ю., Стрижов В.В. Выбор моделей глубокого обучения субоптимальной сложности с использованием вариационной оценки правдоподобия // Автоматика и телемеханика, 2018.
2. Смердов А.Н., Бахтеев О.Ю., Стрижов В.В. Выбор оптимальной модели рекуррентной сети в задачах поиска парафраза // Информатика и ее применения, 2018.
3. [11] Вариационный вывод.
4. [12] Релаксация на основе вариационного вывода.
5. [13] DARTS.
Базовый алгоритм: случайный поиск и алгоритм DARTS (выбор модели с использованием релаксации без вариационного вывода).
РешениеПредлагается выбирать структуру нейросети на основе вариационного вывода. Для выбора оптимальной структуры используется релаксация: от строго выбора одной из нескольких рассматриваемых подмоделей нейросети предлагается перейти к композиции этих моделей с различным весом каждой из них.
Новизна: Предложен метод автоматического построения модели, учитывающий неточности при оптимизации параметров модели и позволяющий находить наиболее устойчивые модели.
Авторы: О.Ю. Бахтеев, В.В. Стрижов

Задача 48

Название: Мультимоделирование, привилегированное обучение
Задача: Рассматривается задача обучения одной модели с помощью другой
Данные: Выборки временных рядов
Литература:
1. https://github.com/neychev/distillation_n_privileged_info_torch
2. https://github.com/neychev/Multitask_forecast_code
3. Статья по Mixture Experts
4. Диплом Нейчева http://www.machinelearning.ru/wiki/images/3/36/NeyhevMS_Thesis.pdf
Базовый алгоритм: Смесь экспертов, привилегоированное обучение, дистилляция
Решение Выполнить эксперимент, иллюстрирующий эти подходы
Новизна: Предложен метод прогнозирования, использующий апроорную информацию о принадлежности выборки модели (опубликовать полученные результаты).
Авторы: Р.Г. Нейчев (консультант), В.В. Стрижов

Задача 49

Название: Декодирование сигналов мозга и прогнозирование намерений
Задача: Требуется построить модель, восстанавливающую движение конечностей по кортикограмме.
Данные: neurotycho.org [9] (или пальцы)
Литература:
- Нейчев Р.Г., Катруца А.М., Стрижов В.В. Выбор оптимального набора признаков из мультикоррелирующего множества в задаче прогнозирования // Заводская лаборатория. Диагностика материалов, 2016, 82(3) : 68-74. [10]
- Isachenko R.V., Strijov V.V. Quadratic Programming Optimization with Feature Selection for Non-linear Models // Lobachevskii Journal of Mathematics, 2018, 39(9) : 1179-1187. Article
Базовый алгоритм: Partial Least Squares[11]
Решение: Создать алгоритм выбора признаков, альтернативный PLS и учитывающий неортогональную структуру взаимозависимости признаков.
Новизна: Предложен способ выбора признаков, учитывающий закономерности как и независимой, так и в зависимой переменной. Бонус: исследовать изменения структуры модели при изменении характера выборки.
Авторы: Андрей Задаянчук, В.В. Стрижов

Источник — «http://machinelearning.ru/wiki/index.php?title=%D0%90%D0%B2%D1%82%D0%BE%D0%BC%D0%B0%D1%82%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F_%D0%BD%D0%B0%D1%83%D1%87%D0%BD%D1%8B%D1%85_%D0%B8%D1%81%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B9_%D0%B2_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%BC_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B8_%28%D0%BF%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D0%BA%D0%B0%2C_%D0%92.%D0%92._%D0%A1%D1%82%D1%80%D0%B8%D0%B6%D0%BE%D0%B2%29/%D0%93%D1%80%D1%83%D0%BF%D0%BF%D0%B0_694%2C_%D0%B2%D0%B5%D1%81%D0%BD%D0%B0_2019»