Оригинальный адрес:158. Никто не может /index.PHP/ ах...

Проанализируйте исходный код C++ для распознавания QR-кода, используемого в OpenCV4.
QRCodeDetector в основном включает функции обнаружения и декодирования для внешнего использования для обнаружения и декодирования QR-кодов.
На этот раз давайте сначала рассмотрим часть позиционирования.

основная функция

Класс, который фактически обрабатывает часть позиционирования QR-кода в QRCodeDetector, — это класс QRDetect.
Основные функции класса QRDetect следующие:

// 初始化
void init(const Mat& src, double eps_vertical_ = 0.2, double eps_horizontal_ = 0.1);
// 获取定位，左上·右上·左下三个定位标记的中心点
bool localization();
// 获取二维码四边形区域的四个顶点
bool computeTransformationPoints();
// 计算两条线交叉点
static Point2f intersectionLines(Point2f a1, Point2f a2, Point2f b1, Point2f b2);

Принципиальный анализ

На этот раз я подготовил изображение QR-кода со слегка наклонным углом.
Чтобы четко идентифицировать черные и белые блоки в QR-коде, изображение обрабатывается в оттенках серого, а затем бинаризируется.
Затем найдите точки, соответствующие правилам двумерного кода, из бинаризованного изображения.

// QRDetect::init函数
// ...
// 二值化
adaptiveThreshold(barcode, bin_barcode, 255, ADAPTIVE_THRESH_GAUSSIAN_C, THRESH_BINARY, 83, 2);
// ...

Найдите центральную точку метки позиционирования

поискГоризонтальные линиифункция

Как показано на рисунке ниже, функция searchHorizontalLines в основном предназначена для поиска цветовых блоков на изображении, которые соответствуют соотношению 1:1:3:1:1 по горизонтальной линии.
То есть горизонтальная линия сразу за черным квадратом в центре.

В функции сканируйте строку за строкой, начиная с первой строки, и сохраняйте положение цветового блока инверсии черного и белого цветов.

// QRDetect::searchHorizontalLines函数
// ...
uint8_t future_pixel = 255;
for (int x = pos; x < width_bin_barcode; x++)
{
    if (bin_barcode_row[x] == future_pixel)
    {
        future_pixel = static_cast<uint8_t>(~future_pixel); // 8位反转运算，0 or 255
        pixels_position.push_back(x);
    }
}
// ...

Затем пройдите положение черных и белых перевернутых цветных блоков в этой строке и найдите сегмент линии, который соответствует соотношению 1:1:3:1:1, а отклонение находится в пределах допустимого диапазона.

// QRDetect::searchHorizontalLines函数
// ...
for (size_t i = 2; i < pixels_position.size() - 4; i+=2)
{
    // 五条线段的长度
    test_lines[0] = static_cast<double>(pixels_position[i - 1] - pixels_position[i - 2]);
    test_lines[1] = static_cast<double>(pixels_position[i    ] - pixels_position[i - 1]);
    test_lines[2] = static_cast<double>(pixels_position[i + 1] - pixels_position[i    ]);
    test_lines[3] = static_cast<double>(pixels_position[i + 2] - pixels_position[i + 1]);
    test_lines[4] = static_cast<double>(pixels_position[i + 3] - pixels_position[i + 2]);

    double length = 0.0, weight = 0.0;  // TODO avoid 'double' calculations

    for (size_t j = 0; j < test_lines_size; j++) { length += test_lines[j]; }

    if (length == 0) { continue; }
    for (size_t j = 0; j < test_lines_size; j++)
    {
        // 根据1:1:3:1:1比例，中间的线段应占7分之3的比例，其余为7分之1
        // 累加线段偏移此比例的值
        if (j != 2) { weight += fabs((test_lines[j] / length) - 1.0/7.0); }
        else        { weight += fabs((test_lines[j] / length) - 3.0/7.0); }
    }

    // 偏移值在容差范围内的话保存进结果
    if (weight < eps_vertical)
    {
        Vec3d line;
        line[0] = static_cast<double>(pixels_position[i - 2]); // 水平线x值
        line[1] = y; // 水平线y值
        line[2] = length; // 水平线长度
        result.push_back(line);
    }
}
// ...

функция разделения вертикальных линий

Далее по найденной горизонтальной линии найти точку на вертикальной линии, соответствующую закону,
Это делает функция extractVerticalLines в функции SeparateVerticalLines.
Предустановка состоит в том, чтобы начать с вертикальной центральной точки и искать пропорции верхней и нижней сторон по очереди.
Таким образом, соотношение составляет 2:2:6:2:2.

Это в основном то же самое, что и нахождение горизонтальной линии, но поскольку вертикальная линия определяется на основе горизонтальной линии, найденной ранее,
Итак, на этот раз вы можете напрямую определить длину каждого сегмента линии, всего их 6.

// QRDetect::extractVerticalLines
// ...
// --------------- Search vertical up-lines --------------- //

test_lines.clear();
uint8_t future_pixel_up = 255;

int temp_length_up = 0;
for (int j = y; j < bin_barcode.rows - 1; j++)
{
    uint8_t next_pixel = bin_barcode.ptr<uint8_t>(j + 1)[x];
    temp_length_up++; // 遇到颜色反转前长度累加
    if (next_pixel == future_pixel_up)
    {
        future_pixel_up = static_cast<uint8_t>(~future_pixel_up);
        test_lines.push_back(temp_length_up);
        temp_length_up = 0;
        if (test_lines.size() == 3)
            break;
    }
}

// --------------- Search vertical down-lines --------------- //

int temp_length_down = 0;
uint8_t future_pixel_down = 255;
for (int j = y; j >= 1; j--)
{
    uint8_t next_pixel = bin_barcode.ptr<uint8_t>(j - 1)[x];
    temp_length_down++; // 遇到颜色反转前长度累加
    if (next_pixel == future_pixel_down)
    {
        future_pixel_down = static_cast<uint8_t>(~future_pixel_down);
        test_lines.push_back(temp_length_down);
        temp_length_down = 0;
        if (test_lines.size() == 6)
            break;
    }
}
// ...

Определите соотношение длин 6 отрезков и сохраните горизонтальные линии в пределах допустимого диапазона.
Здесь следует отметить, что, поскольку центральный квадрат разделен на два отрезка, соотношение суждений составляет 3/14.

// QRDetect::extractVerticalLines
// ...
// --------------- Compute vertical lines --------------- //

if (test_lines.size() == 6)
{
    double length = 0.0, weight = 0.0;  // TODO avoid 'double' calculations

    for (size_t i = 0; i < test_lines.size(); i++)
        length += test_lines[i];

    CV_Assert(length > 0);
    for (size_t i = 0; i < test_lines.size(); i++)
    {
        if (i % 3 != 0)
        {
            weight += fabs((test_lines[i] / length) - 1.0/ 7.0);
        }
        else
        {
            // 中心方块被分为两段，所以比例是14分之3
            weight += fabs((test_lines[i] / length) - 3.0/14.0);
        }
    }

    if (weight < eps)
    {
        result.push_back(list_lines[pnt]);
    }
}
// ...

После оценки компактности возвращается центральная точка каждого сегмента линии, и функция завершается.

Функции K-средних и точек фиксации

На вертикальной линии есть несколько центральных точек, которые пропорциональны диапазону допуска.
Используйте алгоритм кластеризации K-средних, чтобы разделить все точки на три набора и вычислить их центральные точки,
Обычно в это время получается центр установочной метки.

Затем в функции fixationPoints эти три точки проверяются.

Убедитесь, что косинусы трех точек находятся в диапазоне:

// QRDetect::fixationPoints
// ...
double cos_angles[3], norm_triangl[3];

norm_triangl[0] = norm(local_point[1] - local_point[2]);
norm_triangl[1] = norm(local_point[0] - local_point[2]);
norm_triangl[2] = norm(local_point[1] - local_point[0]);

cos_angles[0] = (norm_triangl[1] * norm_triangl[1] + norm_triangl[2] * norm_triangl[2]
              -  norm_triangl[0] * norm_triangl[0]) / (2 * norm_triangl[1] * norm_triangl[2]);
cos_angles[1] = (norm_triangl[0] * norm_triangl[0] + norm_triangl[2] * norm_triangl[2]
              -  norm_triangl[1] * norm_triangl[1]) / (2 * norm_triangl[0] * norm_triangl[2]);
cos_angles[2] = (norm_triangl[0] * norm_triangl[0] + norm_triangl[1] * norm_triangl[1]
              -  norm_triangl[2] * norm_triangl[2]) / (2 * norm_triangl[0] * norm_triangl[1]);

const double angle_barrier = 0.85;
if (fabs(cos_angles[0]) > angle_barrier || fabs(cos_angles[1]) > angle_barrier || fabs(cos_angles[2]) > angle_barrier)
{
    local_point.clear();
    return;
}
// ...

Чтобы определить, какая точка является левым верхним углом, определите точку, ближайшую к 90 градусам, по значению косинуса,
И определить, является ли точка с наибольшей площадью (текст непрост для описания), образованная пересечением трехточечного связанного отрезка линии и позиционной метки.

// QRDetect::fixationPoints
// ...
size_t i_min_cos =
   (cos_angles[0] < cos_angles[1] && cos_angles[0] < cos_angles[2]) ? 0 :
   (cos_angles[1] < cos_angles[0] && cos_angles[1] < cos_angles[2]) ? 1 : 2;

size_t index_max = 0;
double max_area = std::numeric_limits<double>::min();
for (size_t i = 0; i < local_point.size(); i++)
{
    const size_t current_index = i % 3;
    const size_t left_index  = (i + 1) % 3;
    const size_t right_index = (i + 2) % 3;

    const Point2f current_point(local_point[current_index]),
        left_point(local_point[left_index]), right_point(local_point[right_index]),
        // 当前点至另外两点的中心点的线段与图像底部线段的交叉点
        central_point(intersectionLines(current_point,
                          Point2f(static_cast<float>((local_point[left_index].x + local_point[right_index].x) * 0.5),
                                  static_cast<float>((local_point[left_index].y + local_point[right_index].y) * 0.5)),
                          Point2f(0, static_cast<float>(bin_barcode.rows - 1)),
                          Point2f(static_cast<float>(bin_barcode.cols - 1),
                                  static_cast<float>(bin_barcode.rows - 1))));


    vector<Point2f> list_area_pnt;
    list_area_pnt.push_back(current_point);

    // 遍历三条线段，并找出与当前定位标识外框所交错的三个点
    vector<LineIterator> list_line_iter;
    list_line_iter.push_back(LineIterator(bin_barcode, current_point, left_point));
    list_line_iter.push_back(LineIterator(bin_barcode, current_point, central_point));
    list_line_iter.push_back(LineIterator(bin_barcode, current_point, right_point));

    for (size_t k = 0; k < list_line_iter.size(); k++)
    {
        LineIterator& li = list_line_iter[k];
        uint8_t future_pixel = 255, count_index = 0;
        for(int j = 0; j < li.count; j++, ++li)
        {
            const Point p = li.pos();
            if (p.x >= bin_barcode.cols ||
                p.y >= bin_barcode.rows)
            {
                break;
            }

            const uint8_t value = bin_barcode.at<uint8_t>(p);
            if (value == future_pixel)
            {
                future_pixel = static_cast<uint8_t>(~future_pixel);
                count_index++;
                if (count_index == 3)
                {
                    list_area_pnt.push_back(p);
                    break;
                }
            }
        }
    }

    // 计算外框交错的三点与当前点形成的四边形面积
    const double temp_check_area = contourArea(list_area_pnt);
    // 形成的面积最大的当前点即为左上角的点
    if (temp_check_area > max_area)
    {
        index_max = current_index;
        max_area = temp_check_area;
    }

}
// 第一个位置放左上角的点
if (index_max == i_min_cos) { std::swap(local_point[0], local_point[index_max]); }
else { local_point.clear(); return; }
// ...

Наконец, определите порядок нижней левой и верхней правой точек и решите, следует ли поменять местами по определителю

// QRDetect::fixationPoints
// ...
const Point2f rpt = local_point[0], bpt = local_point[1], gpt = local_point[2];
Matx22f m(rpt.x - bpt.x, rpt.y - bpt.y, gpt.x - rpt.x, gpt.y - rpt.y);
// 行列式反转判断
if( determinant(m) > 0 )
{
    std::swap(local_point[1], local_point[2]);
}
// ...

Найдите вершины четырехугольника области QR-кода

Расчет затопления и выпуклой оболочки

Сначала найдите внешнюю рамку метки позиционирования через центральные точки трех меток позиционирования.
Используйте заливку, чтобы заполнить контур в маске.

Затем вычислите выпуклую оболочку набора из трех внешних ящиков, чтобы получить окружающие точки.

// QRDetect::computeTransformationPoints
// ...
vector<Point> locations, non_zero_elem[3], newHull;
vector<Point2f> new_non_zero_elem[3];
for (size_t i = 0; i < 3; i++)
{
    Mat mask = Mat::zeros(bin_barcode.rows + 2, bin_barcode.cols + 2, CV_8UC1);
    uint8_t next_pixel, future_pixel = 255;
    int count_test_lines = 0, index = cvRound(localization_points[i].x);
    for (; index < bin_barcode.cols - 1; index++)
    {
        next_pixel = bin_barcode.ptr<uint8_t>(cvRound(localization_points[i].y))[index + 1];
        if (next_pixel == future_pixel)
        {
            future_pixel = static_cast<uint8_t>(~future_pixel);
            count_test_lines++;
            if (count_test_lines == 2)
            {
                // 找到外框的点，进行填充
                floodFill(bin_barcode, mask,
                          Point(index + 1, cvRound(localization_points[i].y)), 255,
                          0, Scalar(), Scalar(), FLOODFILL_MASK_ONLY);
                break;
            }
        }
    }
    Mat mask_roi = mask(Range(1, bin_barcode.rows - 1), Range(1, bin_barcode.cols - 1));
    findNonZero(mask_roi, non_zero_elem[i]);
    newHull.insert(newHull.end(), non_zero_elem[i].begin(), non_zero_elem[i].end());
}
// 对三个外框的集合进行凸包计算
convexHull(newHull, locations);
// ...

Среди окружающих точек две точки с наибольшим расстоянием — это две вершины слева внизу и справа вверху.
Точка с наибольшей площадью, которая может быть образована нижним левым и верхним правым, является верхней левой вершиной.

// QRDetect::computeTransformationPoints
// ...
double pentagon_diag_norm = -1;
Point2f down_left_edge_point, up_right_edge_point, up_left_edge_point;
for (size_t i = 0; i < new_non_zero_elem[1].size(); i++)
{
    for (size_t j = 0; j < new_non_zero_elem[2].size(); j++)
    {
        double temp_norm = norm(new_non_zero_elem[1][i] - new_non_zero_elem[2][j]);
        if (temp_norm > pentagon_diag_norm)
        {
            down_left_edge_point = new_non_zero_elem[1][i];
            up_right_edge_point  = new_non_zero_elem[2][j];
            pentagon_diag_norm = temp_norm;
        }
    }
}

if (down_left_edge_point == Point2f(0, 0) ||
    up_right_edge_point  == Point2f(0, 0) ||
    new_non_zero_elem[0].size() == 0) { return false; }

double max_area = -1;
up_left_edge_point = new_non_zero_elem[0][0];

for (size_t i = 0; i < new_non_zero_elem[0].size(); i++)
{
    vector<Point2f> list_edge_points;
    list_edge_points.push_back(new_non_zero_elem[0][i]);
    list_edge_points.push_back(down_left_edge_point);
    list_edge_points.push_back(up_right_edge_point);

    double temp_area = fabs(contourArea(list_edge_points));
    if (max_area < temp_area)
    {
        up_left_edge_point = new_non_zero_elem[0][i];
        max_area = temp_area;
    }
}
// ...

Четвертая вершина в правом нижнем углу определяется пересечением нижнего левого и верхнего правого внешних блоков, доходящих до нижнего правого угла.

transformation_points.push_back(down_left_edge_point);
transformation_points.push_back(up_left_edge_point);
transformation_points.push_back(up_right_edge_point);
transformation_points.push_back(
    intersectionLines(down_left_edge_point, down_max_delta_point,
                      up_right_edge_point, up_max_delta_point));

перспективное преобразование

В части декодирования четыре найденные вершины используются для преобразования перспективы, а изображение преобразуется во фронтальную перспективу.
В основном используются функции findHomography и warpPerspective (perspectiveTransform можно использовать для простого преобразования координат).

const Point2f centerPt = QRDetect::intersectionLines(original_points[0], original_points[2],
                                                     original_points[1], original_points[3]);
if (cvIsNaN(centerPt.x) || cvIsNaN(centerPt.y))
    return false;

const Size temporary_size(cvRound(test_perspective_size), cvRound(test_perspective_size));

vector<Point2f> perspective_points;
perspective_points.push_back(Point2f(0.f, 0.f));
perspective_points.push_back(Point2f(test_perspective_size, 0.f));

perspective_points.push_back(Point2f(test_perspective_size, test_perspective_size));
perspective_points.push_back(Point2f(0.f, test_perspective_size));

perspective_points.push_back(Point2f(test_perspective_size * 0.5f, test_perspective_size * 0.5f));

vector<Point2f> pts = original_points;
pts.push_back(centerPt);
// 单应矩阵
Mat H = findHomography(pts, perspective_points);
Mat bin_original;
adaptiveThreshold(original, bin_original, 255, ADAPTIVE_THRESH_GAUSSIAN_C, THRESH_BINARY, 83, 2);
Mat temp_intermediate;
// 图片转换
warpPerspective(bin_original, temp_intermediate, H, temporary_size, INTER_NEAREST);
no_border_intermediate = temp_intermediate(Range(1, temp_intermediate.rows), Range(1, temp_intermediate.cols));

Тогда фактическая функция декодирования вызывается библиотекой quirc, которая не будет здесь объясняться.

Суммировать

Весь процесс сводится к:

Отсканируйте изображение по горизонтали и вертикали и найдите правильные точки по трем меткам позиционирования.
Используйте kmeans, чтобы найти центральную точку трех наборов, то есть получить центр трех позиционных меток.
FloodFill заполняет внешний фрейм, а затем использует выпуклую оболочку для вычисления окружающих точек трех внешних фреймов.
Две точки с наибольшим расстоянием — это вершины нижнего левого и верхнего правого углов четырехугольника QR-кода, а точка, которая может образовать наибольшую площадь с нижней левой и верхней правой вершинами, — это верхняя левая вершина.
Точка в правом нижнем углу получается из пересечения выносных линий нижней левой и верхней правой вершин
Используйте получившиеся четыре вершины для преобразования перспективы и преобразования во фронтальное изображение.
Вызов библиотеки quirc для декодирования