Нейросетевые методы обработки изображений (В.В.Китов)
Материал из MachineLearning.
(→Время занятий) |
(→Лектор) |
||
Строка 11: | Строка 11: | ||
==Лектор== | ==Лектор== | ||
[[Участник:Victor Kitov|Виктор Владимирович Китов]], к.ф.-м.н., преподаватель кафедры [[Mmp|математических методов прогнозирования]] [http://cmc.msu.ru ВМК МГУ]. | [[Участник:Victor Kitov|Виктор Владимирович Китов]], к.ф.-м.н., преподаватель кафедры [[Mmp|математических методов прогнозирования]] [http://cmc.msu.ru ВМК МГУ]. | ||
- | |||
- | |||
Почта: v.v.kitov(at)yandex.ru. | Почта: v.v.kitov(at)yandex.ru. |
Версия 19:17, 8 февраля 2025
О курсе
Спецкурс проходит на ф-те ВМиК в весеннем семестре и посвящен задаче автоматической стилизации изображений, в которой входное изображение необходимо отобразить в стиле, задаваемым другим изображением. Например, это может быть стилизация семейной фотографии под стиль известного художника, либо стилизация дневного фото в ночное, либо преобразование фотогрфии в схематичную книжную иллюстрацию. Для решения задачи существуют современные подходы переноса стиля (style transfer) и генеративно-состязательные сети (generative adversarial networks). Эта задача широко используется в индустрии разлечений (например, мобильное приложение Prisma было самым скачиваемым на Android в странах СНГ в течение 10 дней после выхода), при обработке фотографий и дизайне (функции стилизации были добавлены в Adobe Photoshop 2021), может применяться в мультипликации, наложении спецэффектов в фильмах, видеоиграх и средствах дополненной реальности, а также для более точной настройки методов машинного при обучении на одной предметной области, а применении модели к другой (transfer learning). Помимо изображений указанный подход применим для видеопоследовательностей и данных из других предметных областей (текст, речь и музыка). Основные методы стилизации были предложены в последние 7 лет и опираются на глубокие нейронные сети, базовому изучению которых посвящена начальная часть курса.
Занятия проходят в формате лекций. В процессе прохождения курса каждый студент должен сделать презентацию основных идей и подходов одной из недавних статей, посвященных стилизации изображений, а также представить свои идеи улучшений традиционных методов стилизации изображений и их обосновать.
Пройденный спецкурс вы можете позже перезачесть в учебной части на 4м курсе (по учебному плану вам тогда нужно проходить спецкурс по выбору). Спецкурс познакомит вас с нейросетями - их основными архитектурами (многослойный персептрон, сверточная сеть, автокодировщик, генеративно-состязательные сети), что может служить преимуществом при распределении на кафедры соответствующей направленности.
Лектор
Виктор Владимирович Китов, к.ф.-м.н., преподаватель кафедры математических методов прогнозирования ВМК МГУ.
Почта: v.v.kitov(at)yandex.ru.
Время занятий
Время и место пока определяются.
Лекции
Нейросети. Многослойный персептрон.
Оптимизационный метод переноса стиля.
Трансформационный метод переноса стиля.
Патчевый метод переноса стиля.
Технические улучшения методов стилизации изображений.
Концептуальные улучшения методов стилизации изображений.
Мульти-стилевые трансформационные модели.
Генеративно-состязательные сети.
Экзамен
Оценка за спецкурс ставится только по результатам устного экзамена.
Рекомендуемые ресурсы
- Глубокое машинное обучение, онлайн-учебник по машинному обучению и нейросетям.
- Обзорная статья по переносу стиля на изображениях.
- Образовательные материалы по библиотеке PyTorch.
- Поиск google по статьям.