Овладейте принципом обнаружения изображений с помощью SIFT.
Представление ключевых моментов
Несколько ключевых моментов были найдены и уточнены в пространстве DoG, так как же следует представлять эти ключевые моменты?
Ключевые точки могут быть представлены с помощью троек, где три значения представляют расположение, масштаб и ориентацию ключевой точки. Зачем вычислять ориентацию характерных точек? Это сделано для того, чтобы дескриптор функции имел свойства, не зависящие от вращения.
Определение направления точки выборки (фактически это градиент соответствующей позиции на соответствующем масштабном изображении):
— масштабное изображение соответствующего масштаба.
Направление ключевой точки определяется точками выборки в окружающей области.Например, все точки выборки в области вычисляют значение градиента и направление, делят направление на несколько интервалов, а затем используют функцию Гаусса для взвешивания окружающие точки выборки.Например, в статье 360° делится на 36 бинов, затем наше статистическое направление падает на выборку в каждой бине, а значение градиента выборки умножается на гауссовский вес и добавляется к этому бину, а получается гистограмма направления длиной 36 м. Изображение. На этой гистограмме направления столбцы, соответствующие самым большим пикам, являются направлениями ключевых точек. Если имеется несколько пиков или есть бины, превышающие максимальное пиковое значение более чем в 0,8 раза, то в этой точке создается несколько ключевых точек, а положения и шкалы этих ключевых точек одинаковы.
локальный дескриптор изображения
Найдя ключевые точки изображения в разных масштабах, мы также надеемся охарактеризовать особенности вокруг ключевых точек, чтобы облегчить последующую классификацию или операции сопоставления.
Локальные объекты заведомо неотделимы от области вокруг ключевой точки Окрестность радиусом 16 вблизи ключевой точки разбивается на подобласти (рекомендуется в статье) В каждой подобласти гистограмма направлений статистической длины 8 (длина гистограммы в статье равна 8), каждая гистограмма называется исходной точкой, а дескриптор признака такой ключевой точки представляет собой вектор длины .
Средняя точка представляет собой обнаруженную ключевую точку, синяя точка представляет собой точку пикселя на изображении этой шкалы, красный квадрат представляет собой разделенную подобласть, а исходная точка получается из гистограммы статистического направления каждой подобласти. Здесь мы просто показываем, конкретный размер области будет подробно обсуждаться далее. Мы также замечаем оранжево-желтую стрелку от ключевой точки, которая указывает ориентацию ключевой точки.
Инвариантность вращения дескриптора
Теперь снова посмотрите на изображение. Изображение представляет собой обычную прямоугольную область. У нас также есть фиксированные правила в гистограмме статистического направления. Выбор прямоугольной области, как правило, параллелен краю изображения. Если каждое ключевое направление зафиксировано на одинаковом направлении, результаты, обнаруженные в одной и той же области с помощью фиксированного правила, очень похожи, что позволяет избежать влияния угла поворота. Как правило, изображение можно повернуть так, чтобы направление ключевых точек было равномерно выровнено с направлением оси X изображения, а затем повернутое изображение делится на подобласти для подсчета гистограммы направления. Значение после поворота координат
Здесь угол между направлением ключевой точки и направлением оси X. Угол отрицательный при вращении по часовой стрелке и положительный при вращении против часовой стрелки. Когда гистограмма направления подсчитывает значения в точках сетки, приращение в направлении o равно
удалить световые эффекты
Чтобы устранить влияние освещения, векторы признаков, генерируемые ключевыми точками, обычно нормализуются.
это дисперсия. Порог вектора дескриптора. Нелинейное освещение, изменения насыщенности камеры приведут к тому, что значение градиента некоторых направлений будет слишком большим, а различение направлений будет слабым. Поэтому после нормализации большее значение градиента усекается на 0,2, а затем снова нормализуется, чтобы улучшить различение признаков.