ExtremeNet обнаруживает четыре полюса цели, а затем геометрически объединяет их для обнаружения цели с производительностью, сравнимой с другими традиционными формами алгоритмов обнаружения. Метод обнаружения ExtremeNet очень уникален, но он содержит больше методов постобработки, поэтому есть много возможностей для улучшения.Если вам интересно, вы можете перейти к части анализа ошибок бумажного эксперимента.
Источник: Заметки по разработке алгоритмов Xiaofei Public Account.
Диссертация: Обнаружение объектов снизу вверх путем группировки экстремальных и центральных точек
- Адрес бумаги:АР Вест V.org/ABS/1901.08…
- Код диссертации:GitHub.com/line неделя/…
Introduction
При обнаружении объектов общие методы определяют объект как прямоугольную рамку, которая обычно содержит много фоновой информации, препятствующей обнаружению. С этой целью в документе предлагается, чтобы ExtremeNet определяла местонахождение цели, обнаруживая четыре полюса цели, как показано на рисунке 1. Общий алгоритм улучшен на основе идеи CornerNet, Он использует пять тепловых карт для прогнозирования четырех полюсов и центральной области цели соответственно, объединяет полюса разных тепловых карт и оценивает, основана ли комбинация на значение комбинированного геометрического центра на центральной тепловой карте соответствует требованиям. Кроме того, полюса, обнаруженные ExtremeNet, могут взаимодействовать с сетью DEXTR для прогнозирования информации о целевой сегментации.
ExtremeNet for Object detection
ExtremeNet использует HourglassNet для обнаружения ключевых точек с учетом классов, следуя шагам обучения CornerNet, функции потерь и прогнозированию значения смещения, где прогнозирование значения смещения не зависит от класса, а центральная точка не содержит значений смещения. Выход магистральной сетитепловая карта Чжан,Карта признаков смещения,— количество категорий, а общая структура и выходные данные показаны на рисунке 3. При извлечении полюсов они объединяются в соответствии с геометрическим соотношением.
Center Grouping
Полюса расположены в разных направлениях от цели, и их комбинация будет очень сложной.В документе считается, что в комбинации векторов встраивания, таких как CornerNet, будет отсутствовать глобальная информация, поэтому для комбинации полюсов предлагается группировка по центру.
Процесс группировки центров показан в Алгоритме 1. Сначала получаются пиковые точки на тепловой карте четырех полюсов. Пиковые точки должны удовлетворять двум требованиям: 1) Его значение должно быть больше порогового значения2) Это локальное максимальное значение, и значение пиковой точки должно быть больше, чем окружающие восемь точек.Процесс получения пиковой точки называется ExtrectPeak. После получения точек пика на каждой карте интенсивности пройдите комбинацию каждой точки пика, и для комбинации точек пика, которая удовлетворяет геометрическому соотношению (,,,), вычислить его точку геометрического центра, если значение точки геометрического центра удовлетворяет, считается, что комбинация пиковых точек соответствует требованиям.
Ghost box suppression
В случае равноудаленного распределения трех целей одинакового размера центральная группировка может дать ошибочную оценку с высокой достоверностью. В это время может быть два случая для цели в середине, один из которых является правильным прогнозом, а другой ошибочно объединен с объектом по соседству для вывода.В документе во втором случае поле прогноза называется полем-призраком. Чтобы решить эту ситуацию, в документе добавлен метод постобработки soft-NMS.Если сумма уровней достоверности полей предсказания, содержащихся в поле предсказания, больше чем в три раза, разделите его достоверность на два, а затем выполните НМС.
Edge aggregation
Полюс иногда не уникален.Если цель имеет горизонтальную или вертикальную границу, все точки на ребре являются полюсами, и значение прогноза сети для точек на этой границе будет небольшим, что может привести к пропущенному обнаружению полюса .
В статье используется агрегация ребер для решения этого сценария.Для локальных максимумов левой и правой тепловых карт оценки агрегируются в вертикальном направлении, а локальные максимумы верхней и нижней тепловых карт агрегируются в горизонтальном направлении. Агрегируйте монотонно убывающие дроби в соответствующем направлении, пока не встретится локальный минимум в направлении агрегации. Предположениеточка локального максимума,является точкой в горизонтальном направлении, определитьи— ближайший локальный минимум с обеих сторон, т. е.и, то пиковое значение агрегации ребер обновляется как,вДля веса агрегации установите значение 0,1, общий эффект показан на рисунке 4.
Extreme Instance Segmentation
Штанга содержит больше информации о цели, чем bbox, в конце концов, в два раза больше информации о метке (8 против 4). На основе четырех полюсов и bbox в документе предлагается простой метод получения информации о маске цели. Во-первых, линия длиной 1/4 длины bbox расширяется с полюсом в центре. Если линия превышает bbox, его усекают, а затем четыре линии соединяют встык, чтобы получить восемь линий ребра, как показано на рисунке 1. Наконец, метод DEXTR (Deep Extreme Cut) используется для дальнейшего получения информации о маске. Сеть DEXTR может преобразовывать информацию о полюсах в информацию о сегментации. Здесь восьмиугольный снимок экрана напрямую вводится в предварительно обученную сеть DEXTR.
Experiments
Сравнительные эксперименты каждого модуля, кроме того, в статье был проведен анализ ошибок в ExtremeNet, заменен вывод каждого модуля на GT, и, наконец, достигнуто 86.0AP.
Сравнение с другими методами SOTA.
Эффект сегментации экземпляра.
Conclusion
ExtremeNet обнаруживает четыре полюса цели, а затем геометрически объединяет их для обнаружения цели с производительностью, сравнимой с другими традиционными формами алгоритмов обнаружения. Метод обнаружения ExtremeNet очень уникален, но он содержит больше методов постобработки, поэтому есть много возможностей для улучшения.Если вам интересно, вы можете перейти к части анализа ошибок в эксперименте статьи.
Если эта статья была вам полезна, ставьте лайк или смотрите~
Для получения дополнительной информации, пожалуйста, обратите внимание на общедоступную учетную запись WeChat [Примечания по разработке алгоритмов Xiaofei].