Нейросетевые методы обработки изображений (В.В.Китов)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Экзамен)
 
(41 промежуточная версия не показана)
Строка 3: Строка 3:
==О курсе==
==О курсе==
-
Спецкурс проходит на ф-те ВМиК в весеннем семестре и посвящен задаче автоматической стилизации изображений, в которой входное изображение необходимо преобразовать так, чтобы сохранить изображенные на нем предметы, но стилистику их отображения взять из другого изображения или группы изображений. Например, это может быть стилизация семейной фотографии под стиль известного художника, либо стилизация дневного фото в ночное, либо изменение зимней панорамы в летнюю. Эта задача может применяться в мультипликации, наложении спецэффектов в фильмах и видеоиграх, симуляторах и средствах дополненной реальности, а также для более точной настройки методов машинного обучения работе с изображениями за счет расширения обучающей выборки путем вариации стиля и адаптации стиля под целевую предметную область. Помимо отдельных изображений указанный подход применим для видеопоследовательностей и данных из других предметных областей (текст, речь и т.д.). Основные методы стилизации были предложены в последние 5 лет и опираются на глубинные нейронные сети, базовому изучению которых посвящена существенная часть курса.
+
Спецкурс проходит на ф-те ВМиК в весеннем семестре и посвящен задаче автоматической стилизации изображений, в которой входное изображение необходимо отобразить в стиле, задаваемым другим изображением. Например, это может быть стилизация семейной фотографии под стиль известного художника, либо стилизация дневного фото в ночное, либо преобразование фотогрфии в схематичную книжную иллюстрацию. Для решения задачи существуют современные подходы переноса стиля (style transfer) и генеративно-состязательные сети (generative adversarial networks). Эта задача широко используется в индустрии разлечений (например, мобильное приложение Prisma было самым скачиваемым на Android в странах СНГ в течение 10 дней после выхода), при обработке фотографий и дизайне (функции стилизации были добавлены в Adobe Photoshop 2021), может применяться в мультипликации, наложении спецэффектов в фильмах, видеоиграх и средствах дополненной реальности, а также для более точной настройки методов машинного при обучении на одной предметной области, а применении модели к другой (transfer learning). Помимо изображений указанный подход применим для видеопоследовательностей и данных из других предметных областей (текст, речь и музыка). Основные методы стилизации были предложены в последние 7 лет и опираются на глубокие нейронные сети, базовому изучению которых посвящена начальная часть курса.
-
Спецкурс проходит на ф-те ВМиК в весеннем семестре и посвящен задаче автоматической стилизации изображений, в которой входное изображение необходимо преобразовать так, чтобы сохранить изображенные на нем предметы, но стилистику их отображения взять из другого изображения или группы изображений. Например, это может быть стилизация семейной фотографии под стиль известного художника, либо стилизация дневного фото в ночное, либо изменение зимней панорамы в летнюю. Эта задача может применяться в мультипликации, наложении спецэффектов в фильмах и видеоиграх, симуляторах и средствах дополненной реальности, а также для более точной настройки методов машинного обучения работе с изображениями за счет расширения обучающей выборки путем вариации стиля и адаптации стиля под целевую предметную область. Помимо отдельных изображений указанный подход применим для видеопоследовательностей и данных из других предметных областей (текст, речь и т.д.). Основные методы стилизации были предложены в последние 5 лет и опираются на глубинные нейронные сети, базовому изучению которых посвящена существенная часть курса.
+
 
-
+
Занятия проходят в формате лекций. В процессе прохождения курса каждый студент должен сделать презентацию основных идей и подходов одной из недавних статей, посвященных стилизации изображений, а также представить свои идеи улучшений традиционных методов стилизации изображений и их обосновать.
-
+
 
-
+
==Экзамен==
 +
[https://disk.yandex.ru/i/sU37mxSPkDMOvw Процедура экзамена и список билетов].
 +
 
==Лектор==
==Лектор==
[[Участник:Victor Kitov|Виктор Владимирович Китов]], к.ф.-м.н., преподаватель кафедры [[Mmp|математических методов прогнозирования]] [http://cmc.msu.ru ВМК МГУ]. Почта: v.v.kitov(at)yandex.ru.
[[Участник:Victor Kitov|Виктор Владимирович Китов]], к.ф.-м.н., преподаватель кафедры [[Mmp|математических методов прогнозирования]] [http://cmc.msu.ru ВМК МГУ]. Почта: v.v.kitov(at)yandex.ru.
 +
==Время занятий==
 +
Занятия проходят в удаленном формате по понедельникам 18-00 - 19-30 по [https://us06web.zoom.us/j/81357650774?pwd=RWZNZzl6VmJGNlo1eDJrZy9XN0xPQT09 ссылке].
 +
Первое занятие 14 февраля.
-
=Материалы лекций=
+
==Лекции==
-
+
 
-
[https://yadi.sk/i/IfR0TdxpHAhmRA Введение в машинное обучение.]
+
[https://disk.yandex.ru/i/X92ZQYaDmJdMSA Нейросети. Многослойный персептрон.]
-
[https://yadi.sk/i/H_Oi0oL1tzqBRw Многослойный персептрон.]
+
 
-
[https://yadi.sk/i/jIbSmgR_2akThg Сверточные нейросети.]
+
[https://disk.yandex.ru/i/ebaaTEilmOpmuw Оптимизация методами градиентного и стохастического градиентного спуска.]
-
[https://yadi.sk/i/XnAZ-fLKX9Bpmg Основные архитектуры сверточных нейросетей.]
+
 
-
[https://yadi.sk/i/fHZUcrVFWFbODw Оптимизационный метод переноса стиля.]
+
[https://disk.yandex.ru/i/UwuewOCgomtK7Q DropOut, Batch-нормализация.]
-
[https://yadi.sk/i/_6AInrhKcJzl9A Трансформационный метод переноса стиля.]
+
 
-
[https://yadi.sk/i/dzghc0Ufxi7zMw Перенос стиля, основанный на патчах.]
+
[https://disk.yandex.ru/i/1Myn1D-_A-nxRg Сверточные нейросети.]
-
[https://yadi.sk/i/TGA1AOP64G1a_Q Технические улучшения.]
+
 
-
[https://yadi.sk/i/gVypaP4Kmql_rw Концептуальные улучшения.]
+
[https://disk.yandex.ru/i/x9b8eq_JcWB_KQ Расширение выборки изображений.]
-
[https://yadi.sk/i/uiDNs7aAe2-tUw Мульти-стилевые трансформационные модели.]
+
 
-
[https://yadi.sk/i/QwndMEu3to27dg Расширение обучающей выборки.]
+
[https://disk.yandex.ru/i/ki9WMCubvdhdGA Архитектуры сверточных нейросетей для задачи классификации.]
-
[https://yadi.sk/i/MVFsFttnAV_YMg Генеративно-состязательные сети.]
+
 
 +
[https://disk.yandex.ru/i/lZEK0TYOIg2Dhw Оптимизационный метод переноса стиля.]
 +
 
 +
[https://disk.yandex.ru/i/lLfe3zOC0IX28Q Трансформационный метод переноса стиля.]
 +
 
 +
[https://disk.yandex.ru/i/9jzeENMDEA3-eA Патчевый метод переноса стиля.]
 +
 
 +
[https://disk.yandex.ru/i/4RMfxk1Lg5eC9Q Технические улучшения методов стилизации изображений.]
 +
 
 +
[https://disk.yandex.ru/i/GJQPwB02CJXoaA Концептуальные улучшения методов стилизации изображений.]
 +
 
 +
[https://disk.yandex.ru/i/f7D9e7dX-iOfjA Мульти-стилевые трансформационные модели.]
 +
 
 +
[https://disk.yandex.ru/i/ng48clrTsdE_6w Семантическая сегментация.]
 +
 
 +
[https://disk.yandex.ru/i/gN5hPPNT8V8EdQ Детекция объектов.]
 +
 
 +
[https://disk.yandex.ru/i/ps83_Hr5W_7P-g Генеративно-состязательные сети.]
 +
 
 +
[https://disk.yandex.ru/i/PuWnGsJKImCTqg Приложения генеративно-состязательных сетей.]
-
==Экзамен==
 
-
 
-
-
 
-
 
-
-
 
-
[https://yadi.sk/i/AdqMYWQ36bh0VA Билеты]
 
-
 
-
-
 
-
 
-
-
 
=Рекомендуемые ресурсы=
=Рекомендуемые ресурсы=
-
 
-
-
 
* Примеры переноса стиля для видео: [https://www.youtube.com/watch?v=Khuj4ASldmU пример 1], [https://www.youtube.com/watch?v=vMyMUNvsGfQ пример 2], [https://www.youtube.com/watch?v=BcflKNzO31A пример 3].
* Примеры переноса стиля для видео: [https://www.youtube.com/watch?v=Khuj4ASldmU пример 1], [https://www.youtube.com/watch?v=vMyMUNvsGfQ пример 2], [https://www.youtube.com/watch?v=BcflKNzO31A пример 3].
-
 
-
-
 
* [https://arxiv.org/pdf/1705.04058.pdf Обзорная статья по переносу стиля для изображений.]
* [https://arxiv.org/pdf/1705.04058.pdf Обзорная статья по переносу стиля для изображений.]
-
 
-
-
 
* [https://www.youtube.com/playlist?list=PL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv Лекции курса в Стэнфорде по сверточным нейронным сетям.]
* [https://www.youtube.com/playlist?list=PL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv Лекции курса в Стэнфорде по сверточным нейронным сетям.]
-
 
-
-
 
* [http://www.pittnuts.com/2015/07/top-conferences-on-machine-learning-and-computer-vision/ Топовые конференции по машинному обучению и компьютерному зрению] (самые интересные статьи там)
* [http://www.pittnuts.com/2015/07/top-conferences-on-machine-learning-and-computer-vision/ Топовые конференции по машинному обучению и компьютерному зрению] (самые интересные статьи там)
-
 
-
-
 
* [https://scholar.google.ru/ Поиск google по статьям.]
* [https://scholar.google.ru/ Поиск google по статьям.]
-
 
-
-
 
* [https://pytorch.org/tutorials/ Образовательные материалы по библиотеке глубинного обучения PyTorch.]
* [https://pytorch.org/tutorials/ Образовательные материалы по библиотеке глубинного обучения PyTorch.]
-
 
-
-
 
* [http://d2l.ai/index.html Книга по глубинному обучению.]
* [http://d2l.ai/index.html Книга по глубинному обучению.]

Текущая версия


О курсе

Спецкурс проходит на ф-те ВМиК в весеннем семестре и посвящен задаче автоматической стилизации изображений, в которой входное изображение необходимо отобразить в стиле, задаваемым другим изображением. Например, это может быть стилизация семейной фотографии под стиль известного художника, либо стилизация дневного фото в ночное, либо преобразование фотогрфии в схематичную книжную иллюстрацию. Для решения задачи существуют современные подходы переноса стиля (style transfer) и генеративно-состязательные сети (generative adversarial networks). Эта задача широко используется в индустрии разлечений (например, мобильное приложение Prisma было самым скачиваемым на Android в странах СНГ в течение 10 дней после выхода), при обработке фотографий и дизайне (функции стилизации были добавлены в Adobe Photoshop 2021), может применяться в мультипликации, наложении спецэффектов в фильмах, видеоиграх и средствах дополненной реальности, а также для более точной настройки методов машинного при обучении на одной предметной области, а применении модели к другой (transfer learning). Помимо изображений указанный подход применим для видеопоследовательностей и данных из других предметных областей (текст, речь и музыка). Основные методы стилизации были предложены в последние 7 лет и опираются на глубокие нейронные сети, базовому изучению которых посвящена начальная часть курса.

Занятия проходят в формате лекций. В процессе прохождения курса каждый студент должен сделать презентацию основных идей и подходов одной из недавних статей, посвященных стилизации изображений, а также представить свои идеи улучшений традиционных методов стилизации изображений и их обосновать.

Экзамен

Процедура экзамена и список билетов.

Лектор

Виктор Владимирович Китов, к.ф.-м.н., преподаватель кафедры математических методов прогнозирования ВМК МГУ. Почта: v.v.kitov(at)yandex.ru.

Время занятий

Занятия проходят в удаленном формате по понедельникам 18-00 - 19-30 по ссылке. Первое занятие 14 февраля.

Лекции

Нейросети. Многослойный персептрон.

Оптимизация методами градиентного и стохастического градиентного спуска.

DropOut, Batch-нормализация.

Сверточные нейросети.

Расширение выборки изображений.

Архитектуры сверточных нейросетей для задачи классификации.

Оптимизационный метод переноса стиля.

Трансформационный метод переноса стиля.

Патчевый метод переноса стиля.

Технические улучшения методов стилизации изображений.

Концептуальные улучшения методов стилизации изображений.

Мульти-стилевые трансформационные модели.

Семантическая сегментация.

Детекция объектов.

Генеративно-состязательные сети.

Приложения генеративно-состязательных сетей.

Рекомендуемые ресурсы

Личные инструменты