Обработка изображений в системах искусственного интеллекта (курс лекций, И.А.Матвеев)
Материал из MachineLearning.
Algneushev (Обсуждение | вклад)
(Новая: {{TOCright}} В курсе рассматриваются теоретические основы обработки и анализа изображения, основные подхо...)
К следующему изменению →
Версия 00:34, 16 апреля 2019
В курсе рассматриваются теоретические основы обработки и анализа изображения, основные подходы и модели для описания объектов на изображениях в системах компьютерного зрения и искусственного интеллекта.
Компьютерное зрение относится к области создания искусственных интеллектуальных систем, которые получают информацию из изображений и на ее основе формируют знания. Изображения регистрируются с помощью видео датчиков (видеокамер) в различных частотных диапазонах, и могут быть представлены с помощью двумерных матриц яркости, откликов двумерного сенсора.
Автоматический анализ, распознавание объектов на изображениях и видео, восстановление структуры 3D сцены являются основными задачами компьютерного зрения. Как правило, они разбиваются на несколько подзадач: предобработка, выделение характерных свойств изображения объекта, классификация и заключение (принятие решения). Этап предобработки обычно включает такие операции с изображением, как фильтрация, выравнивание яркости, геометрические корректирующие преобразования для облегчения устойчивого выделения характерных свойств объекта, которые понимаются как некоторый набор признаков, приближённо описывающий интересующий объект и его поведение. Классификация строится путем анализа набора признаков, полученного на предыдущем этапе, разделения признакового пространства на подобласти, указывающие на соответствующий класс. Принадлежность к некоторому классу зарегистрированного объекта или структуры на изображении используется в последующих этапах принятия решения в интеллектуальной системе.
Предлагаемый курс фокусируется на изложении основных математических моделей и алгоритмов предобработки, выделения характерных свойств изображения объектов для формирования набора признаков с целью дальнейшей классификации и анализа.
От студентов требуются знания курсов линейной алгебры, математического анализа, теории вероятностей.
Курс читается студентам 4 курса кафедры «Интеллектуальные системы / проектирование и организация систем» ФУПМ МФТИ. Программа лекционного курса рассчитана на 32 часа (семестр), предусмотрены практические (семинарские) занятия (16 часов) и лабораторные работы (16 часов).
Замечания для студентов
- На подстранице имеется перечень вопросов к устному экзамену.
- О найденных ошибках и опечатках сообщайте мне. — А.Н.Гнеушев 7 августа 2024
- Короткая ссылка на эту страницу: http://bit.ly/ML_ISD_CV.
Программа курса
Задачи обработки изображений в системах искусственного интеллекта
- Путь сигнала при обработке: регистрация сенсором – выделение признаков – классификация – представление в системе – построение заключения (выработка управляющего сигнала).
- Глаз и сетчатка – естественные устройство и сенсор получения изображений. Первичная обработка изображения в сетчатке и зрительной коре головного мозга.
- Искусственные устройства получения изображений. Модели изображений.
Операции над изображениями
- Классификация различных видов операций над изображениями
- Точечные методы обработки изображений
- Гистограмма, операции с гистограммой: нормализация, эквализация, гамма-коррекция и т.п.
- Алгебраические и геометрические преобразования изображения
Пространственно-локальные методы обработки изображений (фильтры)
- Пространственная частота изображения. Свертка изображения.
- Построение фильтров. Низкочастотные, полосные и высокочастотные фильтры.
- Выделение края. Фильтры направленного градиента, Лапласа, Собеля.
Математическая морфология
- Нелинейные фильтры, фильтры порядковых статистик, релаксации.
- Частные случаи фильтров порядковых статистик: эрозия, дилатация, медиана.
- Морфологические операции на дискретных изображениях, частный случай бинарного изображения
Спектральный анализ изображений
- Дискретное преобразование Фурье.
- Преобразования Адамара, Уолша, Хаара.
- Быстрые методы расчёта спектральных преобразований.
Вейвлет-анализ
- Базис функций Габора
- Дискретное вейвлет-преобразование
- Анализ мод вейвлет-преобразования
- Вейвлет-анализ как метод выделения пространственной и частотной структуры данных
Выделение признаков и сегментация
- Текстура и методы её анализа
- Понятие связности. Метод «лесного пожара».
- Сегментация методами водораздела и квадрирования.
- Диаграммы Вороного
Представление и описание областей изображения
- Цепные коды, стягивающие ломаные.
- Методы слияния и разбиения при построении границ.
- Сигнатуры (одномерные функции описания границ).
- Остовы областей. Преобразование к главным осям, методы утоньшения.
Поиск объектов заданной формы
- Алгебраический и морфологический корреляторы.
- Обобщённое преобразование Хафа, аналогия со свёрткой
- Преобразования Хафа для прямых и окружностей
Оптические потоки
- Алгоритмы Лукаса-Канаде, Хорна-Шунка.
Проективная геометрия и восстановление трёхмерной структуры
- Однородные координаты, эпиполярная геометрия, фундаментальная матрица.
- Восстановление формы из движения, из стерео, из затенения, из расфокусировки.
Семинары
Построение фильтров
- Низкочастотные, полосные и высокочастотные фильтры.
- Фильтры направленного градиента, Лапласа, Собеля.
- Фильтр Кэнни.
Фильтры порядковых статистик, релаксации
- Частные случаи фильтров порядковых статистик: эрозия, дилатация, медиана.
- Морфологические операции на дискретных изображениях, частный случай бинарного изображения.
Текстура и методы её анализа
- Понятие связности.
- Метод «лесного пожара».
- Сегментация методами водораздела и квадрирования.
Описание областей изображения
- Цепные коды, стягивающие ломаные.
- Методы слияния и разбиения при построении границ.
- Сигнатуры (одномерные функции описания границ).
Оптические потоки
- Алгоритмы Лукаса-Канаде, Хорна-Шунка.
Проективная геометрия
- Однородные координаты, эпиполярная геометрия, фундаментальная матрица.
- Восстановление формы из движения, из стерео, из затенения, из расфокусировки.
Лабораторные работы
Темы работ
- Изучение растрового представления изображения и методов работы с ним. Применение фильтров первичной обработки изображения для выделения признаков различного рода.
- Написание собственного кода, реализующего некоторые простые операции над изображением (построение пирамиды, линейные фильтры с заданным ядром и т.п.)
- Изучение морфологических операторов над изображением. Морфологическое выделение границ, выделение объектов оператором «попадание-промах».
- Изучение различных методов описания признаков изображения. Сравнение вычислительной сложности и информационной ёмкости описаний.
Необходимое программное обеспечение
- среда разработки и компилятор языка C/C++
- библиотека OpenCV
- среда разработки Python
Литература
Основная литература
- Гонсалес Р., Вудс Р. Цифровая обработка изображений. М., Техносфера, 2005 – 1072 с.
- Методы компьютерной обработки изображений. Под ред. В.А.Сойфера. М., Физматлит, 2003. – 780 с.
- Шапиро Л, Стокман Дж. Компьютерное зрение. М., БИНОМ. Лаборатория знаний, 2006 – 752 с.
- Форсайт Д, Понс Ж. Компьютерное зрение. Современный подход. М., Издательский дом «Вильямс», 2004 – 928 с.
- Яне Б. Цифровая обработка изображений М.: Техносфера, 2007 – 584 с.
- Duda R.O., Hart P.E., Stork D.G Pattern classification. New York, Wiley Interscience Publication, 2001 – 654 p.
Дополнительная литература
- Ту Дж., Гонсалес Р. Принципы распознавания образов. М., Мир, 1978 – 412 с.
- Фукунага К. Введение в статистическую теорию распознавания образов. М., Наука, 1979 – 368 с.
- Харман Г. Современный факторный анализ. М., Статистика, 1972 – 486 с.
- Шеффе Г. Дисперсионный анализ. М., Наука. 1980 – 512 с.
- Факторный дискриминантный и кластерный анализ. Под ред. И.С. Енюкова. М., Финансы и статистика, 1989 – 215 с.
- Гренандер У. Лекции по теории образов м.: Мир, 1981 – 448 с.
Программу составил
И.А. Матвеев, д.т.н.
См. также
- Кафедра «Интеллектуальные системы» ФУПМ МФТИ
- Специализация «Проектирование и организация систем» кафедры «Интеллектуальные системы» ФУПМ МФТИ
- Расписание специализации «Проектирование и организация систем»
Список подстраниц
Обработка изображений в системах искусственного интеллекта (курс лекций, И.А.Матвеев)/Вопросы | Обработка изображений в системах искусственного интеллекта (курс лекций, И.А.Матвеев)/Вопросы 1 семестр |