предложенный вопрос
Автор сначала указал, что рама LiDAR — это не трехмерная структура в строгом смысле, а 2,5-мерная структура. Поскольку LiDAR обычно получает структурные особенности только части цели, близкой к датчику, структуру части, удаленной от датчика, обычно трудно получить из-за окклюзии. Авторы называют эту проблему промахом формы Авторы отвечают на два важных вопроса о промахах формы во введении:
- Какова основная причина промаха формы в облаке точек.
- Влияние промаха формы на обнаружение 3D-объектов.
Есть три основные причины потери формы:
- Наружная окклюзия. Объекты впереди блокируют объекты сзади, что затрудняет восприятие датчиком объектов сзади.
- Сигнал потерян. Из-за материала цели или датчика часть сигнала датчика теряется, что затрудняет восприятие датчиком этой области.
- самоокклюзия. Близкая к датчику часть самого объекта блокирует часть, удаленную от датчика.
Влияние промаха формы на обнаружение 3D-объектов:
Обзор метода
представляет собой центральную точку прогнозируемой ограничивающей рамки,представляет размер ограничивающей рамки,представляет форму объекта, который можно наблюдать,Представляет форму закрытой цели.представляет параметры детектора,Представляет облако точек.
Цели обычных детекторов 3D-объектов:
Для некоторых сетей с поддержкой структуры они также добавилиМониторинг данных. Таким образом, приведенную выше формулу можно записать в виде:
Однако ни в одном исследовании не рассматривалась полная форма мишени, где полную форму мишени можно разделить на две части, одна из которых представляет собой форму наблюдаемой мишени, а другая представляет собой закрытую форму мишени. можно записать как. Занятость BtcNet путем прогнозирования формы интересующей областичтобы явно использовать полную целевую форму. Затем сеть Btc выполняет обнаружение объекта на основе предполагаемой вероятности занятости объекта. Оптимизированный процесс обнаружения объектов выглядит следующим образом:
Исходя из этого, мы можем кратко обобщить общий процесс сети Btc:
- В первую очередь необходимо выделить те участки, которые окклюзированыи зоны потери сигнала, а затем использовать сеть для генерации вероятности заполнения формы.
- Магистральная 3D-сеть используется для извлечения функций, а сгенерированные функции передаются в сеть RPN для создания 3D-предложений, разреженных тензоров.пришиты к карте объектов.
- Затем BtcNet использует уточнение предложения. местные особенностии многомасштабные карты объектов. Для каждого предложения мы строим локальную сетку, покрывающую поле предложения. BtcDet объединяет локальные геометрические функции в локальную сетку, объединяет функции сетки и генерирует окончательные прогнозы ограничивающей рамки.
узнать форму окклюзии
Аппроксимация формы цели в реперной рамке
Проблемы окклюзии и отсутствия сигнала не позволяют нам получить полную информацию о форме объектов в реперной рамке. Поэтому автор использует следующие два допущения для аппроксимации полной информации о форме цели.
- Большинство объектов переднего плана напоминают ограниченное количество прототипов форм, например, пешеходы имеют несколько фиксированных типов телосложения.
- Объекты переднего плана, особенно транспортные средства и велосипедисты, примерно симметричны.
В связи с этим автор предлагает эвристической функции,. Его роль состоит в том, чтобы оценить, покрывает ли цель B большую часть цели A и могут ли предоставленные точки заполнить недостающие части цели A. Чтобы иметь возможность приблизиться к полной форме A, мы выбрали три мишени с наибольшим количеством очков.. Следовательно, полной целью конечного приближения является исходная точка A и трибаллы суммируются. Среди них цель A представляет собой закрытую цель в текущей сцене, а B — цель из той же категории в обучающем наборе.
Имея приведенную выше приблизительную полную форму цели, мы можем различить окклюзированную область, сравнив исходную форму цели.и области отсутствия сигнала.
Различать в сферических координатах
В реальных датчиках в тетраэдрической усеченной карте глубины есть не более одной точки, и когда точка лазера останавливается, все области за этой точкой перекрываются. Поэтому, чтобы иметь возможность лучше идентифицировать окклюзированные области, авторы предлагают использовать сферические сетки для вокселизации облака точек. В этом случае воксели в сферических координатах за любой точкой являются закрытыми вокселами. Поэтому заштрихованная областьВключает непустые сферические воксели и пустые воксели, лежащие за этими вокселами.
Для областей, где сигнал отсутствует, авторы используют карту глубины, чтобы найти пиксели, лежащие на границах с сигналами радара и без них, а затем спроецировать их в сферические воксели.
До сих пор мы могли определить, какие области являются перекрытыми, а какие нет сигнальными областями в сцене облака точек. Кроме того, у нас есть приблизительная полная форма цели, чтобы мы могли обучить сеть. Во-первых, нам нужно присвоить метку каждому сферическому вокселу.
Создавайте тренировочные цели
в затененной зонеи область потери сигнала, нам нужно предсказать вероятность целевого покрытия. Автор использует аппроксимацию системы отсчета, сгенерированную в [2.1] (# для аппроксимации формы цели в системе отсчета)в сферические воксели, содержащиесферических вокселейУстановите на 1, а остальные на 0.
Примечание. Описанная выше процедура предназначена только для.
На изображении выше сферические воксели красного цвета1, а синий 0.
Авторы объясняют, что использование генеративных вероятностей занятости имеет два преимущества по сравнению с генеративными точками:
- Существует несколько вложений целей, форма цели, аппроксимируемая заимствованными точками, неточна, а плотность облака точек разных целей также непостоянна. Эти проблемы можно решить с помощью дискретизации.
- Это может избежать проблемы рациональности создания облака точек.
Создать занятость формы
будетобласть, метод усреднения кодирует непустые сферические воксели. заключается в использовании точек, расположенных на сферических вокселяхдля представления характеристик этого вокселя, а затем эти характеристики передаются в сеть генерации занятости местоположения. Эта часть сети состоит из двух разреженных сверток с пониженной дискретизацией и деконволюций с повышенной дискретизацией. Механизм действия аналогичен разреженной свертке в декартовых координатах. Вероятность занятостиИспользуйте кросс-энтропийную потерю для наблюдения.
Комбинация вероятностей занятости местоположения
так каксоздается в сферической системе координат. Чтобы облегчить обнаружение целей,Преобразуйте в декартову систему координат, а затем используйте магистральную 3D-сеть для извлечения признаков. Поскольку декартов воксель может соответствовать нескольким сферическим системам координат, автор выбирает самую большую из них, расположенную в декартовом вокселе.быть вероятностью этого воксела. Тогда для этих вокселейКроме того, в сочетании с необработанными вокселями максимальное объединение сочетается с многомасштабными функциями необработанных вокселей. Затем сеть RPN генерирует предложение.
Уточнение предложения с учетом окклюзии
Автор также представил в предложении процесс уточнениядля дальнейшего включения этой функции. Кроме того, автор вводит локальную карту объектов.. Автор проанализировал введение в предложение уточнитьДва преимущества:
- Включена только вероятность перекрытых и отсутствующих областей сигнала, потому что других областей за пределами перекрытых и отсутствующих областей сигнала можно избежать в процессе регрессии ограничивающей рамки. Например, красная область × на рисунке ниже.
- Предполагаемая занятость указывает на наличие ненаблюдаемых форм объектов, особенно с высокой, например, оранжевая область на рисунке ниже,
результат
В приведенной выше таблице показаны результаты, полученные в этой статье на тестовом наборе котят.Из таблицы видно, что автор добился большого прогресса на двух уровнях: среднем и редком. Это также свидетельствует об эффективности автора в решении проблемы нехватки формы. Потому что именно эти модные и жесткие цели могут столкнуться с более серьезными проблемами промаха формы.