Современный анализ изображений 2 - Основы обработки изображений

компьютерное зрение

Источник знаний: Видеокурс современного анализа изображений Университета Сидянь.
Преподаватели: Школа электронной инженерии Профессора: Ли Цзе, Гао Синьбо, доценты: Чжан Цзяньлун, Ван Ин, Ван Сюмей, Ван Бин
Общедоступная учетная запись для записи знаний: видение глубокого обучения
Добро пожаловать, чтобы подписаться на эту официальную учетную запись, чтобы получить следующие знания курса

Основы колориметрии

Принцип трех основных цветов

На сетчатке человеческого глаза имеется большое количество колбочковых клеток, которые могут различать цвета при соответствующей яркости. Так называемые три основных цвета относятся к тому факту, что большинство цветов в природе можно смешать с тремя специально подобранными основными цветами. Поэтому три цвета красный, зеленый и синий называются тремя основными цветами.

цветовая модель

Восприятие цвета человеческим зрением может быть представлено оттенком, насыщенностью и яркостью.

  1. Оттенок: указывает тип цвета в зависимости от доминирующей длины волны;
  2. Насыщенность: физическая величина, представляющая оттенок цвета, обычно измеряемая отношением количества смешанного белого света. Чем больше добавляется белого света, тем ниже насыщенность. Розовый смешивается от красного к белому, поэтому насыщенность низкая;
  3. Яркость (оттенки серого): физическая величина того, насколько светлый или темный цвет воспринимается человеческим глазом.

Различные методы представления цветов, известные как цветовые модели. В настоящее время наиболее часто используется модель RGB для машин (таких как мониторы, камеры, принтеры и т. д.) и модель HSI (HSV) для обработки цвета (также для человеческого зрения).

  1. Модель RGB: в трехмерной прямоугольной системе координат три компонента R, G и B представлены тремя взаимно перпендикулярными осями координат, а R, G и B соответственно ограничены [0,1], тогда единичный куб представляет Цветовое пространство, в котором точка представляет цвет. В пространстве RGB количество битов, используемых для описания каждого пикселя, называется глубиной пикселя. Если один пиксель каждого канала является 8-битным, то изображение, состоящее из трех каналов, называется 24-битным изображением, также называемым полноцветным изображением.

  2. Модель HSI использует три атрибута цвета: оттенок H (оттенок), насыщенность S (насыщенность) и яркость I (интенсивность) для формирования цилиндра, представляющего цвет.

Преобразование модели между RGB и HSI

  1. Преобразование RGB в HSI:

  2. Преобразование HSI в RGB:

    ①Когдакогда есть

    ②Когдакогда есть

    ③Когдакогда есть

Строение и механизм человеческого глаза

  1. Зрачок: за прозрачной роговицей находится непрозрачная радужная оболочка, круглое отверстие в середине радужной оболочки называется зрачком, а его диаметр можно регулировать для управления потоком света, попадающим в человеческий глаз (роль апертуры камеры).

  2. Хрусталик: За зрачком находится сплюснутое сферическое эластичное прозрачное тело, кривизну которого можно регулировать для изменения фокусного расстояния, так что на сетчатке отображаются изображения на разных расстояниях (действие объектива фотоаппарата).

  3. Зрительные клетки. В сетчатке имеется большое количество зрительных клеток, которые делятся на две категории: Конусные клетки: фотопические клетки, которые контролируют яркость и цвет при ярком свете. Количество клеток составляет от 6 до 7 миллионов, которые можно разделить на три типа, соответствующие красному, зеленому и синему цвету в видимом свете. Каждая колбочка связана с окончанием зрительного нерва, поэтому разрешение высокое, что используется для различения деталей и цветов; Палочковые (столбчатые) клетки: скотопические клетки, определяющие яркость при слабом освещении без восприятия цвета. Примерно от 75 до 150 миллионов. Множественные палочковидные клетки связаны с окончанием зрительного нерва, поэтому разрешение низкое, разрешается только контур изображения. Например, в лунном свете виден только контур, а цвет не очевиден.

  4. Процесс визуализации человеческого глаза: световой сигнал -> оптические клетки -> физиологический электрический сигнал -> зрительный нерв -> центр зрительного нерва -> визуализация мозга.

оцифровка изображения

  1. Равномерная выборка: преобразование пространственно непрерывных изображений в дискретные точки;
  2. Интервал выборки: расстояние между точками выборки. Увеличение интервала выборки приводит к меньшему количеству пикселей изображения, более низкому пространственному разрешению и худшему качеству. Чем меньше интервал дискретизации, тем больше пикселей в результирующем изображении, выше пространственное разрешение и лучше качество изображения, но больше объем данных.
  3. Квантование: процесс преобразования оттенков серого пикселей в дискретные целочисленные значения. Количество различных значений серого в цифровом изображении называется уровнем серого, обозначаемым буквой G. Общий уровень серого цифрового изображения G представляет собой целую степень числа 2. Чем больше уровней квантования, тем богаче результирующие слои изображения, чем выше разрешение в градациях серого, тем лучше качество, но чем больше объем данных; чем меньше уровней квантования, тем менее насыщены уровни изображения, тем ниже разрешение в градациях серого, и чем хуже качество, тем и ложные изображения будут появляться Контурное явление, но объем данных невелик.
  4. Неравномерная выборка: измените интервал выборки в соответствии с богатством деталей изображения.Когда детали богаты, интервал выборки мал, в противном случае интервал велик.
  5. Неравномерное квантование: квантование с большим интервалом дискретизации для областей с небольшим количеством слоев изображения и квантование с малым интервалом для областей с богатыми слоями изображения.

Представление и характеристики цифрового изображения

  1. Большой объем информации: ДЗЗ N=1024, G=2^8=256, тогда емкость=N^2 K=8МБ
  2. Более широкая занимаемая полоса частот: по сравнению с голосовой информацией полоса пропускания, занимаемая информацией изображения, на несколько порядков больше. Обработка сложна, а стоимость высока. Это выдвигает необходимые (высокие) требования к сжатию изображения (полосы).
  3. Большая корреляция между пикселями: вероятность того, что соседние пиксели в одном кадре имеют одинаковые (или похожие) оттенки серого; корреляция между пикселями, соответствующими соседним кадрам движущегося изображения, больше. Поэтому возможности сжатия изображений велики.
  4. Визуальные эффекты весьма субъективны: изображения представляют собой органичное сочетание образов и изображений, и при обработке следует учитывать зрительные особенности человека.