Когда дело доходит до обнаружения целей, его можно охарактеризовать как одну из ключевых технологий в популярных отраслях, таких как автономное вождение, новая розничная торговля и интеллектуальная промышленность. Обнаружение объектов играет важную роль не только в таких задачах, как обнаружение пешеходов, транспортных средств, товаров и пожаров, но и в сложных задачах, таких как отслеживание объектов, распознавание жестов, управление жестами и поиск изображений.
Примечание*: приведенное выше видео цитируется из общедоступного набора данных [1].
Рис. 1. Пример промышленного применения PaddleDetection.
В соответствии с текущей тенденцией развития отрасли к интеллектуальному анализу на стороне устройства и совместной работе между устройством и облаком развертывание и применение алгоритмов на мобильном терминале особенно важно. По сравнению с унифицированной централизованной обработкой интеллектуальные терминалы могут лучше адаптироваться к различным средам, а затраты на эксплуатацию и обслуживание также ниже. Однако разработать качественную легковесную модель обнаружения объектов не так-то просто, и часто в реальной среде возникает множество проблем:
- Быстрее. Например, в сценариях реального времени, таких как промышленный визуальный контроль качества и автономное вождение, приемлемый диапазон задержки часто находится на уровне миллисекунд, а требования чрезвычайно строгие.
- Точность должна быть высокой. В таких сценариях, как автоматическое вождение и обнаружение пожара, небольшая ошибка может привести к серьезным потерям, а допуск на ложное обнаружение и пропущенное обнаружение очень низок.
- Небольшой размер. При развертывании на периферийных терминалах, таких как мобильные телефоны, транспортные средства и IoT, вычислительная мощность и память ограничены, и алгоритм должен быть чрезвычайно сжат.
- Среда развертывания сложна и разнообразна. Потребляемая мощность и технические характеристики аппаратных устройств различаются. Затраты на адаптацию и развертывание не слишком большие!
Представленная сегодня новейшая облегченная система обнаружения целей PP-PicoDet с открытым исходным кодом предназначена для решения вышеуказанных проблем, оптимизации скорости, точности и удобства развертывания модели и достижения замечательных результатов.
Нечего сказать, прямо предложим реализацию с открытым исходным кодом:
Настоятельно рекомендуется собирать Звезды и детально их изучать.
Параметр PP-PicoDet-S в своей серии составляет всего 0,99M, но имеет точность 30,6% mAP.При размере ввода 320 скорость вывода может достигать даже 150FPS. Мало того, что mAP на 4,8% выше, чем у YOLOX -Nano, но и Скорость вывода также увеличена на 55%, по сравнению с NanoDet, mAP также выше на 7,1%.
С другой стороны, PP-PicoDet-L достигает mAP 40,9% всего с 3,3 миллионами параметров, что на 3,7% выше, чем у YOLOv5, а скорость вывода увеличивается на 44%.
Адрес технического отчета ПП-ПикоДет:
Примечание*: Приведенные выше изображения взяты из отчета [2]
Рис. 2 Сравнение производительности PP-PicoDet
Примечание*: FPS в GIF занимает много времени от начала до конца, включая предварительную обработку, прогнозирование и постобработку.Приведенное выше видео цитируется из общедоступного набора данных [1].
Рисунок 3 Сравнение эффектов мобильного терминала PP-PicoDet и различных моделей
Мало того, PP-PicoDet также является чрезвычайно важным техническим модулем в многоцелевой системе отслеживания в реальном времени PP-Tracking и сверхлегкой модели ключевых точек человеческого тела PP-TinyPose, запущенной PaddleDetection v2.3, летающим веслом. комплект для разработки системы обнаружения целей. Даже в общей системе распознавания изображений PP-ShiTu, которая в последнее время привлекла большое внимание в отрасли, PP-PicoDet также используется в качестве модуля обнаружения объекта, достигая эффекта превосходства большой модели на стороне сервера со сверхмалым размером. !
Руководство по загрузке приложения PP-PicoDet для Android:
Paddle's T.Beijing.Northside dr.com/deploy/TH IR…
(Если по ссылке нет нормального доступа, вы можете скопировать ее в браузер для скачивания)
Теперь давайте рассмотрим конкретные стратегии оптимизации, чтобы сделать PP-PicoDet маленьким, быстрым и точным:
Магистральная сеть с более высокой производительностью
Высокопроизводительная магистральная сеть играет жизненно важную роль в повышении производительности модели обнаружения целей.PP-PicoDet использует разработанную Baidu сверхлегкую и высокоточную магистральную сеть ESNet (Enhanced ShuffleNet), которая обеспечивает полное обнаружение целей. Он не только требует меньше вычислений, меньшей задержки и более высокой точности, но также обладает большей надежностью и может лучше адаптироваться к различным аппаратным средам.
ESNet представляет модуль SE и модуль Ghost в GhostNet на основе ShuffleNetV2 и добавляет свертку с разделением по глубине, которая объединяет различную информацию о канале для повышения точности модели, а также использует поиск нейронной сети (NAS) для более эффективного поиска. структура дополнительно улучшает производительность модели и, наконец, позволяет получить магистральную сеть с повышенной точностью и скоростью.
Примечание*: Приведенные выше изображения и данные цитируются в отчете[2].
Рис. 4. Сравнение производительности ESNet и ShuffleNetV2
Светлая шея и голова
В части шеи PP-PicoDet предлагает структуру CSP-PAN, в которой используется свертка 1*1 для унификации количества каналов функции и минимального количества каналов, выводимых BackBone, тем самым сокращая объем вычислений и гарантируя, что на производительность слияния функций это не влияет. Кроме того, PP-PicoDet снова выполняет субдискретизацию на основе CSP-PAN, добавляя меньший масштаб признаков для улучшения эффекта обнаружения крупных объектов (см. ветвь P6 на рисунке ниже).
В то же время PP-PicoDet использует свертку с разделением по глубине как в части шеи, так и в части головы, и увеличивает ядро свертки 3 x 3 до 5 x 5 для увеличения рецептивного поля при сохранении той же скорости. А PP-PicoDet использует «соединительную головку» с тем же количеством каналов, что и Neck, которая имеет более высокую скорость предсказания, чем «развязывающая головка» с небольшим количеством каналов.
Примечание*: Приведенные выше изображения и данные цитируются в отчете[2].
Рисунок 5 Принципиальная схема общей архитектуры PP-PicoDet
Более точная стратегия выборки
Вдохновленный отличными алгоритмами, такими как YOLOX, PP-PicoDet использует более точную стратегию выборки SimOTA, динамически изменяет метод присвоения меток в процессе обучения и эффективно ускоряет сходимость модели, собирая высококачественные выборки в целевой области. На этой основе преобразован расчет матрицы стоимости, и VFL+GIoU используется для замены исходного CELoss+IoU, что может эффективно повысить точность на 1% без потери скорости.
Кроме того, PP-PicoDet также использует функцию активации H-Swish для замены Relu; использует косинусную стратегию затухания скорости обучения; использует Cycle-EMA; добавляет небольшое количество стратегий улучшения данных, таких как Crop, Flip, Multi-Scale и т. д. , После обучения точность модели снова увеличивается на 3%.
Давайте взглянем на окончательный эффект вышеприведенной серии стратегий оптимизации.Из него видно, что PP-PicoDet имеет отличные характеристики с точки зрения точности и скорости!
Примечание*: тестовое оборудование — Snapdragon 865, количество потоков = 4, FP16, NCNN (результат теста Paddle Lite — *), приведенные выше изображения и данные приведены в отчете [2]
Рисунок 6. Сравнение производительности PP-PicoDet на COCO и других легких детекторах.
Более полная поддержка развертывания
Как настоящий инструмент разработки промышленного уровня, PaddleDetection полностью поддерживает Paddle Inference, встроенную библиотеку вывода Paddle Paddle, и Paddle Lite, облегченный механизм вывода Paddle Paddle, что позволяет разработчикам быстро реализовать высокопроизводительное развертывание на основных серверах и конечных устройствах. боковые фишки.
И он поддерживает быстрый экспорт в формат ONNX, так что разработчики могут использовать экологические возможности ONNX для развертывания более широкого спектра алгоритмов, а также могут развертывать и анализировать PP-PicoDet через свой знакомый мобильный движок.
Кроме того, также предоставляется решение для ускоренного развертывания OpenVINO и демоверсия Android, а все коды процессов имеют открытый исходный код, чтобы полностью удовлетворить потребности в развертывании различных аппаратных сред, так что последняя миля глубокого обучения будет безбарьерной!
Такой артефакт обнаружения и разработки целей применялся многими отраслевыми гигантами, такими как State Grid, Wuhan Railway Bureau и CATL, действительно помогая разработчикам и расширяя возможности отраслевой аналитики!
Ссылка на руководство:GitHub.com/paddle pad DL…
Следовать за
Рождение PP-PicoDet произошло из открытого исходного кода, а также является обратной связью с открытым исходным кодом. Принимая во внимание растущий спрос на развертывание облегченных моделей обнаружения целей на мобильных терминалах и периферийных терминалах в различных отраслях, таких как промышленность, Интернет и автономное вождение, PP-PicoDet стремится предоставить действительно промышленно-ориентированный, более производительный и легкий модель обнаружения объектов с весом.Количественные и более простые в реализации решения по обнаружению целей, а не просто следование индикаторам модели.
В то же время я надеюсь, что сам алгоритм и идеи оптимизации PP-PicoDet могут не только предоставить лучшие алгоритмы отраслевым разработчикам, но и вдохновить на оптимизацию алгоритмов, и на этой основе они смогут продолжать улучшать результаты. результаты, вы также можете обсуждать и общаться с нами через группы пользователей, вопросы и т. д. Здесь я надеюсь объединить усилия с отраслевыми разработчиками, чтобы усердно работать над китайской технологией с открытым исходным кодом!
Все вышеперечисленные реализации кода являются открытым исходным кодом в комплекте разработки обнаружения летающих весл PaddleDetection:GitHub.com/paddle pad DL…Заинтересованные партнеры могут испытать, оставить отзыв и принять участие в совместном строительстве! Ваша звезда - величайшее поощрение нашей работы~
Сообщество разработчиков искусственного интеллекта Baiduai.baidu.com/forum, чтобы предоставить разработчикам по всей стране платформу для общения, обмена информацией и ответов на вопросы, чтобы разработчики больше не «работали в одиночку» на пути исследований и разработок и находили лучшие технические решения посредством постоянного обмена мнениями и дискуссий. Если вы хотите попробовать различные технологии искусственного интеллекта и разработать сценарии приложений, как можно скорее присоединяйтесь к AI-сообществу Baidu.Все ваши мечты об искусственном интеллекте могут быть реализованы здесь!
Отсканируйте QR-код ниже и добавьте маленького помощника WeChat «Карта Jingdong, пользовательские периферийные устройства Xiaodu, загадочная подарочная коробка, багаж» и другие преимущества, которые вы можете получить ~