«Возьмите вас, чтобы изучить алгоритм» объясняет работу и принцип Reszie в OpenCV.

алгоритм

Сяо Сун сказал: «При обработке данных изображения часто используется операция изображения Reszie. Поскольку он основан на интерфейсе изменения размера OpenCV, я не понимаю внутреннего принципа, поэтому в этой статье подробно объясняется конкретная операция и принцип.

1 Использование Рези в OpenCV

1.1 Изменение размера интерфейса

OpenCV поддерживает разные языки программирования, вот операция изменения размера для разных языков:

C++:

void resize(InputArray src, OutputArray dst, Size dsize, double fx=0, double fy=0, int interpolation=INTER_LINEAR)  

Python:

cv2.resize(src, dsize[, dst[, fx[, fy[, interpolation]]]]) -> dst  

C:

void cvResize(const CvArr* src, CvArr* dst, int interpolation=CV_INTER_LINEAR)  

1.2 Описание параметров:

источник - исходное изображение

dst - образ назначения. Когда параметр dsize не равен 0, размер dst равен size, в противном случае его размер необходимо определить в соответствии с размером src, параметрами fx и fy. Тип dst такой же, как у изображения src.

dsize - размер целевого изображения. Когда dsize равен 0, его можно рассчитать по следующей формуле:

Поэтому параметр dsize и параметр (fx, fy) не могут быть равны 0 одновременно.

fx - коэффициент масштабирования по горизонтальной оси. Когда он равен 0, формула расчета выглядит следующим образом:

fy - масштабный коэффициент по вертикальной оси. Когда он равен 0, формула расчета выглядит следующим образом:

interpolation — Метод интерполяции

2 Принцип Рези в OpenCV

2.1 Введение в методы интерполяции

метод интерполяции. Есть 5 типов:

1) INTER_NEAREST - интерполяция ближайшего соседа

2) INTER_LINEAR - метод билинейной интерполяции (по умолчанию)

3) INTER_AREA - локальная ресемплинг на основе пикселей (ресамплинг с использованием отношения площади пикселя). Это может быть лучшим подходом для прореживания изображения. Но если изображение увеличено, это похоже на метод ближайшего соседа.

4) INTER_CUBIC — кубическая интерполяция на основе соседства 4x4 пикселей

5) INTER_LANCZOS4 - интерполяция Ланцоша на основе соседства 8x8 пикселей

2.2 Подробный принцип интерполяции

Вот подробное введение в часто используемый метод билинейной интерполяции:

Билинейная интерполяция, также известная как билинейная интерполяция. Математически билинейная интерполяция представляет собой расширение линейной интерполяции интерполяционной функции с двумя переменными Основная идея состоит в том, чтобы выполнить линейную интерполяцию в двух направлениях соответственно.

Прежде чем понять билинейность, вам нужно использовать монолинейную интерполяцию:

Имея данные (x0, y0) и (x1, y1), мы хотим вычислить значение y позиции x на линии в интервале [x0, x1].

На самом деле расстояние между x и x0, x1 используется в качестве веса для взвешивания y0 и y1.

Сяо Сун сказал: "На самом деле, эта операция также очень интуитивно понятна. Линейность означает, что результат находится ближе к точке ближе к точке. Это так называемая взвешенная операция. Билинейная интерполяция — это по существу линейная интерполяция в обоих направлениях.

билинейная интерполяция

Математически билинейная интерполяция представляет собой расширение линейной интерполяции интерполяционной функции с двумя переменными Основная идея состоит в том, чтобы выполнить линейную интерполяцию в двух направлениях соответственно. Увидеть ниже:

Предположим, мы хотим получить значение неизвестной функции f в точке P = (x, y), пусть нам известна функция f в точках Q11 = (x1, y1), Q12 = (x1, y2), Q21 = (x2, y1) и Q22 = (x2, y2) значения четырех точек. В наиболее распространенном случае f — это значение пикселя в пикселе. Сначала выполните линейную интерполяцию в направлении x, чтобы получить

Затем линейно интерполируйте в направлении y, чтобы получить

Комбинация является конечным результатом билинейной интерполяции:

2.3 Реализация кода билинейной интерполяции

Рассчитывается по четырем соседним пикселям (2*2), формула выглядит следующим образом:

Реализация кода основана на C++, а именно:

    cv::Mat matSrc, matDst1, matDst2;
	matSrc = cv::imread("lena.jpg", 2 | 4);
	matDst1 = cv::Mat(cv::Size(800, 1000), matSrc.type(), cv::Scalar::all(0));
	matDst2 = cv::Mat(matDst1.size(), matSrc.type(), cv::Scalar::all(0));
double scale_x = (double)matSrc.cols / matDst1.cols;
double scale_y = (double)matSrc.rows / matDst1.rows;
    uchar* dataDst = matDst1.data;
int stepDst = matDst1.step;
	uchar* dataSrc = matSrc.data;
int stepSrc = matSrc.step;
int iWidthSrc = matSrc.cols;
int iHiehgtSrc = matSrc.rows;
for (int j = 0; j < matDst1.rows; ++j)
float fy = (float)((j + 0.5) * scale_y - 0.5);
		sy = std::min(sy, iHiehgtSrc - 2);
		cbufy[0] = cv::saturate_cast<short>((1.f - fy) * 2048);
		cbufy[1] = 2048 - cbufy[0];
for (int i = 0; i < matDst1.cols; ++i)
float fx = (float)((i + 0.5) * scale_x - 0.5);
if (sx >= iWidthSrc - 1) {
				fx = 0, sx = iWidthSrc - 2;
			cbufx[0] = cv::saturate_cast<short>((1.f - fx) * 2048);
			cbufx[1] = 2048 - cbufx[0];
for (int k = 0; k < matSrc.channels(); ++k)
				*(dataDst+ j*stepDst + 3*i + k) = (*(dataSrc + sy*stepSrc + 3*sx + k) * cbufx[0] * cbufy[0] + 
					*(dataSrc + (sy+1)*stepSrc + 3*sx + k) * cbufx[0] * cbufy[1] + 
					*(dataSrc + sy*stepSrc + 3*(sx+1) + k) * cbufx[1] * cbufy[0] + 
					*(dataSrc + (sy+1)*stepSrc + 3*(sx+1) + k) * cbufx[1] * cbufy[1]) >> 22;
	cv::imwrite("linear_1.jpg", matDst1);
	cv::resize(matSrc, matDst2, matDst1.size(), 0, 0, 1);
	cv::imwrite("linear_2.jpg", mat);

3 примечания по использованию Reszie:

  1. dsize и fx/fy не могут быть равны 0 одновременно, или вы можете указать значение dsize и оставить fx и fy пустыми и напрямую использовать значение по умолчанию, например
    resize(img, imgDst, Size(30,30));
    Или вы можете установить dsize равным 0 и указать значения fx и fy, например, fx=fy=0.5, тогда это эквивалентно удвоению размера исходного изображения в обоих направлениях!
  2. Что касается окончательного метода интерполяции, обычно достаточно билинейной интерполяции по умолчанию.
    Эффективность нескольких распространенных методов: интерполяция ближайшего соседа > билинейная интерполяция > бикубическая интерполяция > интерполяция Ланцоша;
    Однако эффективность и эффект обратно пропорциональны, поэтому используйте его в соответствии со своей ситуацией.
  3. В обычных условиях размер и тип dst-образа до использования неизвестны, тип наследуется от src-изображения, а размер также рассчитывается из исходного изображения в соответствии с параметрами. Но если вы заранее указали размер изображения dst, то вы можете вызвать функцию следующим образом: resize(src, dst, dst.size(), 0, 0, интерполяция); 

-1 ссылка

-1.1 blog.CSDN.net/Смотри, смотри, Цзэн 199…

-1.2 blog.CSDN.net/Фэн Бинчу…

Приглашаем всех обратить внимание на официальный аккаунт Сяо Сун ** «Минимальный ИИ»**, чтобы вы могли научиться глубокому обучению:

Обмен технологиями теоретического обучения и разработки приложений, основанными на глубоком обучении, автор часто делится содержанием сухих товаров глубокого обучения.Когда вы изучаете или применяете глубокое обучение, вы также можете общаться со мной и отвечать на любые вопросы, с которыми вы сталкиваетесь.