Обработка изображений в системах искусственного интеллекта (курс лекций, И.А.Матвеев)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск

Algneushev (Обсуждение | вклад)
(Новая: {{TOCright}} В курсе рассматриваются теоретические основы обработки и анализа изображения, основные подхо...)
К следующему изменению →

Версия 00:34, 16 апреля 2019

Содержание

В курсе рассматриваются теоретические основы обработки и анализа изображения, основные подходы и модели для описания объектов на изображениях в системах компьютерного зрения и искусственного интеллекта.

Компьютерное зрение относится к области создания искусственных интеллектуальных систем, которые получают информацию из изображений и на ее основе формируют знания. Изображения регистрируются с помощью видео датчиков (видеокамер) в различных частотных диапазонах, и могут быть представлены с помощью двумерных матриц яркости, откликов двумерного сенсора.

Автоматический анализ, распознавание объектов на изображениях и видео, восстановление структуры 3D сцены являются основными задачами компьютерного зрения. Как правило, они разбиваются на несколько подзадач: предобработка, выделение характерных свойств изображения объекта, классификация и заключение (принятие решения). Этап предобработки обычно включает такие операции с изображением, как фильтрация, выравнивание яркости, геометрические корректирующие преобразования для облегчения устойчивого выделения характерных свойств объекта, которые понимаются как некоторый набор признаков, приближённо описывающий интересующий объект и его поведение. Классификация строится путем анализа набора признаков, полученного на предыдущем этапе, разделения признакового пространства на подобласти, указывающие на соответствующий класс. Принадлежность к некоторому классу зарегистрированного объекта или структуры на изображении используется в последующих этапах принятия решения в интеллектуальной системе.

Предлагаемый курс фокусируется на изложении основных математических моделей и алгоритмов предобработки, выделения характерных свойств изображения объектов для формирования набора признаков с целью дальнейшей классификации и анализа.

От студентов требуются знания курсов линейной алгебры, математического анализа, теории вероятностей.


Курс читается студентам 4 курса кафедры «Интеллектуальные системы / проектирование и организация систем» ФУПМ МФТИ. Программа лекционного курса рассчитана на 32 часа (семестр), предусмотрены практические (семинарские) занятия (16 часов) и лабораторные работы (16 часов).

Замечания для студентов


Программа курса

Задачи обработки изображений в системах искусственного интеллекта

  • Путь сигнала при обработке: регистрация сенсором – выделение признаков – классификация – представление в системе – построение заключения (выработка управляющего сигнала).
  • Глаз и сетчатка – естественные устройство и сенсор получения изображений. Первичная обработка изображения в сетчатке и зрительной коре головного мозга.
  • Искусственные устройства получения изображений. Модели изображений.

Операции над изображениями

  • Классификация различных видов операций над изображениями
  • Точечные методы обработки изображений
  • Гистограмма, операции с гистограммой: нормализация, эквализация, гамма-коррекция и т.п.
  • Алгебраические и геометрические преобразования изображения

Пространственно-локальные методы обработки изображений (фильтры)

  • Пространственная частота изображения. Свертка изображения.
  • Построение фильтров. Низкочастотные, полосные и высокочастотные фильтры.
  • Выделение края. Фильтры направленного градиента, Лапласа, Собеля.

Математическая морфология

  • Нелинейные фильтры, фильтры порядковых статистик, релаксации.
  • Частные случаи фильтров порядковых статистик: эрозия, дилатация, медиана.
  • Морфологические операции на дискретных изображениях, частный случай бинарного изображения

Спектральный анализ изображений

  • Дискретное преобразование Фурье.
  • Преобразования Адамара, Уолша, Хаара.
  • Быстрые методы расчёта спектральных преобразований.

Вейвлет-анализ

  • Базис функций Габора
  • Дискретное вейвлет-преобразование
  • Анализ мод вейвлет-преобразования
  • Вейвлет-анализ как метод выделения пространственной и частотной структуры данных

Выделение признаков и сегментация

  • Текстура и методы её анализа
  • Понятие связности. Метод «лесного пожара».
  • Сегментация методами водораздела и квадрирования.
  • Диаграммы Вороного

Представление и описание областей изображения

  • Цепные коды, стягивающие ломаные.
  • Методы слияния и разбиения при построении границ.
  • Сигнатуры (одномерные функции описания границ).
  • Остовы областей. Преобразование к главным осям, методы утоньшения.

Поиск объектов заданной формы

  • Алгебраический и морфологический корреляторы.
  • Обобщённое преобразование Хафа, аналогия со свёрткой
  • Преобразования Хафа для прямых и окружностей

Оптические потоки

  • Алгоритмы Лукаса-Канаде, Хорна-Шунка.

Проективная геометрия и восстановление трёхмерной структуры

  • Однородные координаты, эпиполярная геометрия, фундаментальная матрица.
  • Восстановление формы из движения, из стерео, из затенения, из расфокусировки.


Семинары

Построение фильтров

  • Низкочастотные, полосные и высокочастотные фильтры.
  • Фильтры направленного градиента, Лапласа, Собеля.
  • Фильтр Кэнни.

Фильтры порядковых статистик, релаксации

  • Частные случаи фильтров порядковых статистик: эрозия, дилатация, медиана.
  • Морфологические операции на дискретных изображениях, частный случай бинарного изображения.

Текстура и методы её анализа

  • Понятие связности.
  • Метод «лесного пожара».
  • Сегментация методами водораздела и квадрирования.

Описание областей изображения

  • Цепные коды, стягивающие ломаные.
  • Методы слияния и разбиения при построении границ.
  • Сигнатуры (одномерные функции описания границ).

Оптические потоки

  • Алгоритмы Лукаса-Канаде, Хорна-Шунка.

Проективная геометрия

  • Однородные координаты, эпиполярная геометрия, фундаментальная матрица.
  • Восстановление формы из движения, из стерео, из затенения, из расфокусировки.


Лабораторные работы

Темы работ

  1. Изучение растрового представления изображения и методов работы с ним. Применение фильтров первичной обработки изображения для выделения признаков различного рода.
  2. Написание собственного кода, реализующего некоторые простые операции над изображением (построение пирамиды, линейные фильтры с заданным ядром и т.п.)
  3. Изучение морфологических операторов над изображением. Морфологическое выделение границ, выделение объектов оператором «попадание-промах».
  4. Изучение различных методов описания признаков изображения. Сравнение вычислительной сложности и информационной ёмкости описаний.

Необходимое программное обеспечение

  • среда разработки и компилятор языка C/C++
  • библиотека OpenCV
  • среда разработки Python


Литература

Основная литература

  1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М., Техносфера, 2005 – 1072 с.
  2. Методы компьютерной обработки изображений. Под ред. В.А.Сойфера. М., Физматлит, 2003. – 780 с.
  3. Шапиро Л, Стокман Дж. Компьютерное зрение. М., БИНОМ. Лаборатория знаний, 2006 – 752 с.
  4. Форсайт Д, Понс Ж. Компьютерное зрение. Современный подход. М., Издательский дом «Вильямс», 2004 – 928 с.
  5. Яне Б. Цифровая обработка изображений М.: Техносфера, 2007 – 584 с.
  6. Duda R.O., Hart P.E., Stork D.G Pattern classification. New York, Wiley Interscience Publication, 2001 – 654 p.

Дополнительная литература

  1. Ту Дж., Гонсалес Р. Принципы распознавания образов. М., Мир, 1978 – 412 с.
  2. Фукунага К. Введение в статистическую теорию распознавания образов. М., Наука, 1979 – 368 с.
  3. Харман Г. Современный факторный анализ. М., Статистика, 1972 – 486 с.
  4. Шеффе Г. Дисперсионный анализ. М., Наука. 1980 – 512 с.
  5. Факторный дискриминантный и кластерный анализ. Под ред. И.С. Енюкова. М., Финансы и статистика, 1989 – 215 с.
  6. Гренандер У. Лекции по теории образов м.: Мир, 1981 – 448 с.


Программу составил
И.А. Матвеев, д.т.н.

См. также

Список подстраниц

Обработка изображений в системах искусственного интеллекта (курс лекций, И.А.Матвеев)/ВопросыОбработка изображений в системах искусственного интеллекта (курс лекций, И.А.Матвеев)/Вопросы 1 семестр
Личные инструменты