Hengyuan Cloud_opencv (тезисы)

глубокое обучение
Hengyuan Cloud_opencv (тезисы)

Источник статьи |Облачное сообщество Hengyuan

Исходный адрес |opencv

Автор оригинала | instter


Я не знаю, если я не посещаю, но бывают сюрпризы, когда я посещаю! Хахахаха я когда полистал его то увидел новую бумажную заметку выложенную модератором в сообществе Скрин открытия это крит внешности, ах, как раз для этого крит, надо потрудиться что бы его выполнить чтобы дать Take взгляните на больших парней, тогда давайте насладимся прекрасным контентом с редактором!

начало текста

1. Введение в opencv

1 Происхождение изображения

1.1 Что такое изображение

Изображение является основой человеческого зрения, объективным отражением природного пейзажа и важным источником для понимания людьми мира и самих себя. «Картинка» — это распределение отраженного или прошедшего света объекта, «подобно» — это впечатление или познание в мозгу человека варианта картинки, принятого зрительной системой человека, фотографии, картины, картинки, карты, каллиграфия произведения, рукописные китаеведения, факсы, спутниковые облачные изображения, видеоизображения, рентгеновские снимки, ЭЭГ, электрокардиограмма и т. д. — все это изображения. — Яо Минь, Цифровая обработка изображений: Machinery Industry Press, 2014.

dddd8b9612824cdeae21b454cd8e02bd.png

1.2 Аналоговые и цифровые изображения

Изображение произошло от первой постоянной фотографии, изобретенной французским ученым Жозефом Нисефором Ньепсом около 1826 года, которая относится к аналоговому изображению. ==Аналоговое изображение также известно как непрерывное изображение==, которое записывает информацию о яркости изображения посредством изменения интенсивности некоторой физической величины (например, света, электричества и т. д.), поэтому оно непрерывно преобразуется. Характеристики аналоговых сигналов заключаются в том, что они наиболее восприимчивы к помехам, и в настоящее время они в основном заменены цифровыми изображениями.

После Первой мировой войны американские ученые изобрели систему Бартлейна в 1921 году и передали первое цифровое изображение из Лондона в Нью-Йорк, == его яркость представлена ​​дискретными числовыми значениями==, кодируя изображение в 5 уровней градаций серого, как показано на рисунке ниже передается по подводному кабелю. Картинка кодируется и записывается с помощью перфоленты на передающей стороне, а после передачи через систему восстанавливается в образ на принимающей стороне с помощью специального принтера. Примерно в 1950 году был изобретен компьютер, и официально зародилась дисциплина цифровой обработки изображений.1.pngСравнение аналоговых изображений и цифровых изображений мы можем посмотреть на:2.png

2 Представление цифровых изображений

2,1 цифры

Компьютер использует систему кодирования 0/1, и цифровые изображения также используют для записи информации 0/1. Изображения, с которыми мы обычно контактируем, представляют собой 8-значные изображения, включающие от 0 до 255 оттенков серого, где 0 означает самый темный, а 1 означает самый темный. Белый.3.pngЧеловеческий глаз немного более чувствителен к оттенкам серого, между 16 и 32 битами.4.png

2.2 Классификация изображений

Бинарное изображение:Двумерная матрица бинарного изображения состоит только из двух значений, 0 и 1. «0» представляет черный цвет, а «1» — белый. Поскольку каждый пиксель (каждый элемент в матрице) имеет только два возможных значения, 0 и 1, тип данных двоичного изображения в компьютере обычно равен 1 двоичному биту. Двоичные изображения обычно используются для распознавания при сканировании (OCR) текста и штриховых рисунков, а также для хранения изображений масок.

Изображение в оттенках серого:Изображение только с одним выбранным цветом на пиксель, такие изображения обычно отображаются в виде оттенков серого в диапазоне от самого темного черного до самого яркого белого, хотя теоретически эта выборка может быть любого оттенка цвета или даже другого цвета с разной интенсивностью. Изображения в градациях серого отличаются от черно-белых изображений, которые в компьютерной графике имеют только два цвета, черный и белый; однако изображения в градациях серого имеют много уровней глубины цвета между черным и белым. Изображения в градациях серого часто получают путем измерения яркости каждого пикселя в одном электромагнитном спектре, таком как видимый свет.Изображения в градациях серого для отображения обычно хранятся с нелинейной шкалой 8 бит на пиксель выборки, который может иметь 256 уровней серого. (Если вы используете 16 бит, есть 65536 уровней).

Цветовая карта:Каждый пиксель обычно представлен тремя компонентами: красным (R), зеленым (G) и синим (B), а компоненты находятся в диапазоне (0, 255). Изображения RGB, как и индексированные изображения, могут использоваться для представления цветных изображений. Подобно индексированному изображению, оно представляет цвет каждого пикселя как комбинацию трех основных цветов: красного (R), зеленого (G) и синего (B). Однако, в отличие от индексного изображения, значение цвета каждого пикселя изображения RGB (представленного тремя основными цветами RGB) хранится непосредственно в матрице изображения, поскольку цвет каждого пикселя должен быть представлен тремя компонентами R , G и B, M, N представляют количество строк и столбцов изображения соответственно, а три двумерные матрицы M x N представляют три цветовых компонента R, G и B каждого пикселя соответственно. Тип данных изображения RGB обычно представляет собой 8-битное целое число без знака, которое обычно используется для представления и хранения изображений в истинном цвете.

3 OPENCV-PYTHON

OpenCV-Python — это библиотека связывания Python, предназначенная для решения проблем компьютерного зрения.

Python — это язык программирования общего назначения, разработанный Гвидо ван Россумом, который быстро стал очень популярным, главным образом благодаря своей простоте и читабельности кода. Это позволяет программистам выражать идеи в меньшем количестве строк кода без ущерба для удобочитаемости.

Python работает медленно по сравнению с такими языками, как C/C++. Тем не менее, Python легко расширяется с помощью C/C++, что позволяет нам писать ресурсоемкий код на C/C++ и создавать оболочки Python, которые можно использовать в качестве модулей Python. Это дает нам два преимущества: во-первых, код выполняется так же быстро, как исходный код C/C++ (поскольку это фактический код C++, работающий в фоновом режиме), и, во-вторых, код на Python писать проще, чем на C/C++. OpenCV-Python — это оболочка Python для исходной реализации OpenCV C++.

OpenCV-Python использует Numpy, высокооптимизированную библиотеку для работы с базами данных с синтаксисом в стиле MATLAB. Все структуры массивов OpenCV преобразуются в массивы Numpy. Это также упрощает интеграцию с другими библиотеками, использующими Numpy, такими как SciPy и Matplotlib.

3.1 Метод развертывания OpenCV

Перед установкой OpenCV необходимо установить numpy и matplotlib.

Создайте виртуальную среду Python cv и установите ее в cv.

Сначала установите OpenCV-Python.Поскольку некоторые классические алгоритмы защищены авторским правом, новая версия имеет большие ограничения, поэтому выбирайте версию ниже 3.4.3.

pip install opencv-python==3.4.2.17

Теперь вы можете проверить, прошла ли установка успешно.Если при выполнении следующего кода не сообщается об ошибке, установка выполнена успешно.

import cv2
# 读一个图片并进行显示(图片路径需自己指定)
lena=cv2.imread("1.jpg")
cv2.imshow("image",lena)
cv2.waitKey(0)

Если мы хотим использовать SIFT и SURF для извлечения функций, нам также необходимо установить:

pip install opencv-contrib-python==3.4.2.17
3.2 Модули OPENCV

На следующем рисунке перечислены различные модули, включенные в OpenCV:5.png

вcore、highgui、imgprocЭто самый базовый модуль Курс в основном разработан вокруг этих модулей, которые представлены следующим образом:

  • Основной модуль реализует большинство основных структур данных и их основные операции, такие как функции рисования, функции, связанные с манипулированием массивами, и так далее.
  • Модуль highgui реализует интерфейс чтения, отображения и хранения видео и изображений.
  • Модуль imgproc реализует основные методы обработки изображений, включая фильтрацию изображений, геометрическое преобразование изображений, сглаживание, пороговую сегментацию, морфологическую обработку, обнаружение границ, обнаружение объектов, анализ движения и отслеживание объектов.

Для других направлений более высокого уровня и приложений обработки изображений,OpenCVСуществуют также связанные реализации модулей

  • Модуль features2d используется для извлечения признаков изображения и сопоставления признаков, а несвободный модуль реализует некоторые запатентованные алгоритмы, такие как функции просеивания.
  • Модуль objdetect реализует некоторые функции обнаружения целей, такие как классическое обнаружение лиц на основе функций Хаара и LBP, а также обнаружение пешеходов и автомобилей на основе HOG.Классификатор использует каскадную классификацию и латентный SVM.
  • Модуль сшивания реализует функцию сшивания изображений.
  • Модуль FLANN (быстрая библиотека для приближенных ближайших соседей), включая быстрый приблизительный поиск ближайших соседей FLANN и алгоритм кластеризации.
  • модуль машинного обучения модулей (SVM, дерево решений, Boosting и т. д.).
  • Фотомодуль включает в себя две части: закрашивание изображения и шумоподавление изображения.
  • Видеомодуль предназначен для обработки видео, такой как разделение фона, обнаружение переднего плана, отслеживание объектов и т. д.
  • Модуль calib3d называется Calibration 3D и в основном связан с калибровкой камеры и 3D-реконструкцией. Он включает в себя базовые геометрические алгоритмы с несколькими представлениями, калибровку одной стереокамеры, оценку положения объекта, алгоритмы стереоподобия, реконструкцию 3D-информации и многое другое.
  • Модуль G-API содержит сверхэффективный конвейер обработки изображений.

Во-вторых, основная операция opencv

1 операция ввода-вывода изображения

Здесь мы покажем вам, как прочитать изображение, как отобразить изображение и как сохранить изображение.

1.1 Прочитайте изображение

API

cv.imread()

параметр:

  • изображение для чтения

  • флаг режима чтения

    1⃣️ cv.IMREAD*COLOR: загрузить изображение в цветном режиме, любая прозрачность изображения будет игнорироваться. Это параметр по умолчанию.

    2⃣️ cv.IMREAD*GRAYSCALE: загрузить изображение в оттенках серого

    3⃣️ cv.IMREAD_UNCHANGED: загрузить режим изображения, включая альфа-канал.

    Вы можете использовать 1, 0 или -1, чтобы заменить три вышеуказанных флага.

  • Код ссылки

import numpy as np
import cv2 as cv
# 以灰度图的形式读取图像
img = cv.imread('messi5.jpg',0)
1.2 Изображение на дисплее

API

cv.imshow()

параметр:

  • Имя окна, в котором отображается изображение, в виде строки

  • изображение для загрузки

Примечание. После вызова API для отображения изображения вызовите cv.waitKey(), чтобы дать время для отрисовки изображения, иначе окно перестанет отвечать на запросы и изображение не может быть отображено. Кроме того, мы также можем использовать matplotlib для отображения изображения.

  • Код ссылки
# opencv中显示
cv.imshow('image',img)
cv.waitKey(0)
# matplotlib中展示
plt.imshow(img[:,:,::-1])
1.3 Сохраните изображение

API

cv.imwrite()

параметр:

  • имя файла, где его сохранить
  • изображение для сохранения

Код ссылки:

cv.imwrite('messigray.png',img)
1.4 Резюме

Мы делаем это, загружая изображение в градациях серого, отображая изображение и сохраняя изображение, если вы нажмете «s» и выйдете, или просто выйдите без сохранения, нажав ESC.

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
# 1 读取图像
img = cv.imread('messi5.jpg',0)
# 2 显示图像
# 2.1 利用opencv展示图像
cv.imshow('image',img)
# 2.2 在matplotplotlib中展示图像
plt.imshow(img[:,:,::-1])
plt.title('匹配结果'), plt.xticks([]), plt.yticks([])
plt.show()
k = cv.waitKey(0)
# 3 保存图像
cv.imwrite('messigray.png',img)

2 Рисование геометрии

2.1 Рисование прямых линий
cv.line(img,start,end,color,thickness)

параметр:

  • Столбец img: Чтобы нарисовать прямолинейное изображение
  • Столбцы Start,end: начальная и конечная точки линии
  • цвет столбца: цвет строки
  • Толщина столбца: ширина линии
2.2 Нарисуйте круг
cv.circle(img,centerpoint, r, color, thickness)

параметр:

  • img: изображение для рисования круга
  • Центральная точка, r: центр и радиус окружности
  • цвет: цвет линии
  • Толщина: Толщина линии, когда она равна -1, создается замкнутый узор, который заполняется цветом.
2.3 Рисование прямоугольников
cv.rectangle(img,leftupper,rightdown,color,thickness)

параметр:

  • img: изображение для рисования прямоугольника
  • Leftupper, rightdown: координаты левого верхнего и правого нижнего углов прямоугольника
  • цвет: цвет линии
  • Толщина: Ширина линии
2.4 Добавление текста к изображениям
cv.putText(img,text,station, font, fontsize,color,thickness,cv.LINE_AA)

параметр:

  • изображение: изображение
  • text: текстовые данные для записи
  • станция: где будет размещен текст
  • шрифт: шрифт
  • Размер шрифта: размер шрифта
2.5 Отображение эффекта

Мы создаем полностью черное изображение, затем рисуем изображение внутри и добавляем текст

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
# 1 创建一个空白的图像
img = np.zeros((512,512,3), np.uint8)
# 2 绘制图形
cv.line(img,(0,0),(511,511),(255,0,0),5)
cv.rectangle(img,(384,0),(510,128),(0,255,0),3)
cv.circle(img,(447,63), 63, (0,0,255), -1)
font = cv.FONT_HERSHEY_SIMPLEX
cv.putText(img,'OpenCV',(10,500), font, 4,(255,255,255),2,cv.LINE_AA)
# 3 图像展示
plt.imshow(img[:,:,::-1])
plt.title('匹配结果'), plt.xticks([]), plt.yticks([])
plt.show()

результат:

3 Получить и изменить пиксели в изображении

Мы можем получить значение пикселя через значения координат строки и столбца. заBGRimage, который возвращает массив синих, зеленых и красных значений. Для изображений в градациях серого возвращается только соответствующее значение интенсивности. Используйте тот же метод для изменения значений пикселей.

import numpy as np
import cv2 as cv
img = cv.imread('messi5.jpg')
# 获取某个像素点的值
px = img[100,100]
# 仅获取蓝色通道的强度值
blue = img[100,100,0]
# 修改某个位置的像素值
img[100,100] = [255,255,255]

4 Получить свойства изображения

Свойства изображения включают количество строк, столбцов и каналов, тип данных изображения, количество пикселей и т. д.7.png

5 Разделение и объединение каналов изображения

Иногда необходимо работать индивидуально над изображениями канала B, G, R. В этом случае изображение BGR необходимо сегментировать на отдельные каналы. Или, в других случаях, может потребоваться объединить эти отдельные каналы в образ BGR. Вы можете сделать это следующими способами.

# 通道拆分
b,g,r = cv.split(img)
# 通道合并
img = cv.merge((b,g,r))
6 Изменения в цветовом пространстве

В OpenCV существует более 150 методов преобразования цветового пространства. Существует два наиболее широко используемых метода преобразования: BGRGray и BGRHSV.

cv.cvtColor(input_image,flag)

параметр:

  • input_image: изображение для преобразования цветового пространства

  • флаг: тип преобразования

    1⃣️ cv.COLOR_BGR2GRAY : BGRСерый

    2⃣️ cv.COLOR_BGR2HSV: BGR→HSV

3. Арифметические операции

1. Добавление изображений

Вы можете использовать OpenCVcv.add()функция для добавления двух изображений, или может просто передатьnumpyОперация Добавьте два изображения, напримерres = img1 + img2. Оба изображения должны иметь одинаковый размер и тип, иначе второе изображение может быть скалярным значением.

Примечание. Существует разница между добавлением OpenCV и добавлением Numpy. Добавление OpenCV — это операция насыщения, а добавление Numpy — операция по модулю.

См. следующий код:

>>> x = np.uint8([250])
>>> y = np.uint8([10])
>>> print( cv.add(x,y) ) # 250+10 = 260 => 255
[[255]]
>>> print( x+y )          # 250+10 = 260 % 256 = 4
[4]

Эта разница становится более заметной, когда вы добавляете два изображения. Результаты OpenCV немного лучше. Поэтому мы пытаемся использовать функции в OpenCV.

Мы будем использовать следующие два изображения:8.png

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt

# 1 读取图像
img1 = cv.imread("view.jpg")
img2 = cv.imread("rain.jpg")

# 2 加法操作
img3 = cv.add(img1,img2) # cv中的加法
img4 = img1+img2 # 直接相加

# 3 图像显示
fig,axes=plt.subplots(nrows=1,ncols=2,figsize=(10,8),dpi=100)
axes[0].imshow(img3[:,:,::-1])
axes[0].set_title("cv中的加法")
axes[1].imshow(img4[:,:,::-1])
axes[1].set_title("直接相加")
plt.show()

результат

9.png

2. Смешанное изображение

На самом деле это дополнение, но разница в том, что вес двух изображений разный, что создаст у людей смешанное или прозрачное ощущение.. Формула расчета для смешивания изображений выглядит следующим образом:g(x)=(1α)f0(x)+αf1(x)g(x) = (1-\alpha)f_0(x)+\alpha f_1(x)

Изменяя значение α (0 → 1), можно добиться очень крутого смешивания.

Теперь мы объединяем два изображения вместе. Вес первого изображения равен 0,7, а вес второго изображения равен 0,3. функцияcv2.addWeighted()Изображения можно смешивать по приведенной ниже формуле.dst=αing1+βimg2+γdst=α⋅ing1+β⋅img2+γ

Здесь γ принимается равным нулю. См. следующий код:

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt

# 1 读取图像
img1 = cv.imread("view.jpg")
img2 = cv.imread("rain.jpg")

# 2 图像混合
img3 = cv.addWeighted(img1,0.7,img2,0.3,0)

# 3 图像显示
plt.figure(figsize=(8,8))
plt.imshow(img3[:,:,::-1])
plt.show()