SaccadeNet: двухэтапное уточнение поля предсказания с использованием угловых функций | CVPR 2020

алгоритм
SaccadeNet: двухэтапное уточнение поля предсказания с использованием угловых функций | CVPR 2020

SaccadeNet выполняет предварительное позиционирование цели на основе функции центральной точки, а затем использует функции угловой точки и функции центральной точки кадра предварительного прогноза для точной настройки кадра прогноза Общая идея аналогична двухэтапному алгоритму обнаружения цели, кадр предсказания второго этапа уточняется.Вызванные пространственные объекты преобразуются в точечные. SaccadeNet замечателен с точки зрения точности и скорости, и в целом идея очень хороша.


Источник: Заметки по разработке алгоритмов Xiaofei Public Account.

Диссертация: SaccadeNet: быстрый и точный детектор объектов

Introduction


  В неврологии люди не смотрят пристально на сцену при обнаружении цели, а вместо этого осматривают области, богатые информацией, чтобы помочь локализовать цель. Вдохновленный этим механизмом, в документе предлагается SaccadeNet, который может эффективно фокусироваться на ключевых точках цели, богатых информацией, и выполнять локализацию цели от грубой до мелкозернистой.

  Структура SaccadeNet показана на рисунке 2. Сначала изначально прогнозируются центральное положение и угловое положение цели, а затем для регрессионной оптимизации используются особенности четырех угловых положений и положения центральной точки.SaccadeNet содержит четыре модуля:

  • Модуль Center Attentive (Center-Attn) предсказывает центральное положение и категорию цели.
  • Модуль Attention Transitive (Attn-Trans), который предварительно предсказывает угловое положение, соответствующее каждому центральному положению.
  • Модуль Aggregation Attentive Module (Aggregation-Attn) использует особенности центрального и углового положений для оптимизации прогнозируемого кадра.
  • Угловой внимательный модуль (Corner-Attn), который используется для улучшения целевых граничных функций магистральной сети.

  Общая идея SaccadeNet очень хороша, немного похожа на двухэтапную схему обнаружения целей, которая преобразует регрессию поля предсказания второго этапа из региональных признаков в точечные.

Center Attentive Module


  Модуль Center-Attn содержит два простых сверточных слоя, которые преобразуют карту объектов, выдаваемую магистральной сетью, в тепловую карту центральной точки, которую можно использовать для прогнозирования положения центра и его категории для всех объектов на изображении. GT этого модуля такой же, как настройка CornerNet, с использованием ядра Гаусса.eXXk22о2e^{\frac{||X-X_k||^2}{2{\sigma}^2}}Разбросать позицию GT,о\sigmaЭто 1/3 радиуса, радиус определяется размером цели, а точки внутри радиуса гарантированно генерируют поле предсказания с IOU не менее 0,3. Кроме того, функция потерь этого модуля объединяет фокальные потери:

pi,jp_{i,j}положение на тепловой карте(i,j)(i,j)счет,yi,jy_{i,j}является соответствующим значением GT.

Attention Transitive Module


  Выходной размер модуля Attn-Transwf×hf×2w_f\times h_f\times 2, предсказать ширину и высоту поля предсказания, соответствующего каждой позиции, а затем в соответствии с положением его центральной точки(i,j)(i,j)Вычислить соответствующее угловое положение(iwi,j/2,jhi,j/2)(i-w_{i,j}/2, j-h_{i,j}/2),(iwi,j/2,j+hi,j/2)(i-w_{i,j}/2, j+h_{i,j}/2),(i+wi,j/2,jhi,j/2)(i+w_{i,j}/2, j-h_{i,j}/2),(i+wi,j/2,j+hi,j/2)(i+w_{i,j}/2, j+h_{i,j}/2), используя потери регрессии L1 для обучения. На основе модуля Center-Attn и модуля Attn-Trans SaccadeNet может предварительно прогнозировать результаты обнаружения объектов. Кроме того, исходный код документа предоставляет значение смещения дополнительной центральной точки прогнозирования в этом модуле.Для проблемы смещения, вызванной субдискретизацией, значение смещения также обучается с использованием потерь регрессии L1, которые включены по умолчанию.

Aggregation Attentive Module


  Aggregation-Attn — это облегченный модуль, используемый для точной настройки кадра предсказания и вывода более точного кадра предсказания. Модуль Aggregation-Attn получает углы и центральные точки цели из модулей Attn-Trans и Center-Attn и использует билинейную интерполяцию для выборки характеристик соответствующих позиций из выходной карты характеристик из магистральной сети, и наконец, возвращает ширину и высоту.Поправочное значение , весь модуль обучается с потерей L1.

Corner Attentive Module in Training


  Для извлечения богатых информацией угловых функций в документе во время обучения добавляется дополнительная ветвь Corner-Attn, а функции магистральной сети преобразуются в четырехканальную тепловую карту, соответствующую четырем углам цели. Точно так же эта ветвь обучается на основе фокальных потерь и тепловой карты Гаусса, которая не зависит от класса. Этот модуль можно дорабатывать несколько раз итеративно, подобно Cascade R-CNN, который также сравнивается в экспериментальной части статьи.

Relation to existing methods


  Текущие методы обнаружения целей на основе ключевых точек можно разделить на детекторы на основе ключевых точек на краях и детекторы на основе центральных ключевых точек SaccadeNet сочетает в себе преимущества двух методов.
Детекторы на основе ключевых точек обычно сначала обнаруживают углы или полюса, а затем определяют местонахождение цели с помощью комбинации ключевых точек, но такие алгоритмы обычно не могут получить глобальную информацию о цели: функции для улучшения функций. б) Углы обычно располагаются на пикселях фона и содержат меньше информации, чем другие ключевые точки. Хотя SaccadeNet также использует угловые точки для прогнозирования целей, SaccadeNet напрямую прогнозирует цели по центральным ключевым точкам, что позволяет получить глобальную информацию о цели и избежать трудоемких комбинаций ключевых точек.

  Детекторы на основе центральной ключевой точки делают прогноз цели через центральную ключевую точку, выводят тепловую карту центральной точки и возвращаются непосредственно к границе. Тем не менее, центральная точка обычно находится далеко от границы цели, поэтому может быть трудно предсказать точную границу цели, особенно для больших целей. Кроме того, угловые ключевые точки находятся ближе всего к границе и содержат много локальной точной информации.Отсутствие угловой информации может отрицательно сказаться на результатах прогнозирования, и SaccadeNet просто заполняет этот дефект и выполняет более точное прогнозирование границ.

Experiments


  Сравните с алгоритмом обнаружения целей SOTA.

  Сравнительный эксперимент модуля Attn-Trans и модуля Aggregation-Attn.

  Сравнение количества итераций модуля Corner-Attn.

Conclusion


SaccadeNet выполняет предварительное позиционирование цели на основе функции центральной точки, а затем использует функции угловой точки кадра предварительного прогноза и функцию центральной точки для точной настройки кадра прогноза Общая идея аналогична двухэтапному алгоритму обнаружения цели. Кадр предсказания второго этапа точно настроен. Региональные объекты преобразуются в точечные объекты. SaccadeNet отличается точностью и скоростью, а общая идея очень хороша.



Если эта статья была вам полезна, ставьте лайк или смотрите~

Для получения дополнительной информации, пожалуйста, обратите внимание на общедоступную учетную запись WeChat [Примечания по разработке алгоритмов Xiaofei].

work-life balance.