【Часть 7】Центрнет

искусственный интеллект

Резюме

При обнаружении объектов методы на основе ключевых точек часто страдают от большого количества неправильных ограничивающих рамок объекта, возможно, из-за отсутствия дополнительных наблюдений за обрезанными областями. В этой статье предлагается эффективное решение для изучения визуальных паттернов в каждой обрезанной области с минимальными затратами. Мы строим нашу структуру на репрезентативном детекторе на основе ключевых точек под названием CornerNet. Наш метод, названный CenterNet, определяет каждый объект как тройку, а не как пару ключевых точек, что приводит к повышению точности и отзыва. Поэтому мы разработали два пользовательских модуля, называемых каскадным угловым объединением и центральным объединением, которые обогащают информацию, собранную в верхнем левом и нижнем правом углах соответственно, и предоставляют более узнаваемую информацию в центральной области. В наборе данных MS-COCO CenterNet достигает AP 47,0%, превосходя все существующие одноступенчатые детекторы как минимум на 4,9%. Между тем, CenterNet демонстрирует производительность, сравнимую с лучшими двухкаскадными детекторами, с более высокой скоростью логического вывода. Код доступен по адресу https://github.com/Duankaiwen/CenterNet.

1. Введение

С помощью глубокого обучения, особенно сверточных нейронных сетей [11] (CNN), обнаружение объектов значительно улучшилось и улучшилось.

В нынешнюю эпоху одна из самых популярных блок-схем основана на якорных узлах, которые размещают набор прямоугольников заданного размера и с их помощью находят положение реальных объектов. Эти методы обычно требуют большого количества привязок, чтобы обеспечить достаточно высокую скорость IoU (перекрестного связывания) с объектами наземной достоверности, а размер и соотношение сторон каждого блока привязки необходимо проектировать вручную. Кроме того, привязки обычно не выровнены с рамкой достоверности, что не способствует задаче классификации ограничивающей рамки.

Чтобы преодолеть недостатки методов на основе привязки, предлагается предложение по обнаружению объектов на основе ключевых точек под названием CornerNet. Он представляет каждый объект парой угловых характерных точек, что устраняет необходимость в якорных полях и обеспечивает высочайшую точность обнаружения объектов. Тем не менее производительность CornerNet по-прежнему ограничена его относительно слабой способностью ссылаться на глобальную информацию об объектах. То есть, поскольку каждый объект состоит из пары углов, расчет