Изучение и применение технологии распознавания спутниковых изображений при построении данных AutoNavi

искусственный интеллект

Управляемое чтение

Для картографических сервисов точность и охват картографических данных являются ключевыми факторами качества обслуживания, а обновление картографических данных зависит от различных источников информации, таких как тепловые потоки, фактические изображения и спутниковые изображения. В последние годы, в связи с увеличением количества спутников дистанционного зондирования Земли и появлением спектральных камер высокого разрешения, а также характеристик спутниковых снимков с широким охватом, хорошим углом обзора и богатым информационным наполнением, спутниковые снимки играют все более важную роль. важную роль в качестве источника информации для обновления картографических данных.

Для использования спутниковых изображений AutoNavi прошел процесс эволюции от интерфейса пользователя к ручному управлению данными, а затем к активному обнаружению и обновлению картографических данных.Это также процесс постоянного извлечения ценности данных изображения. . В этой статье будут представлены исследования и практика команды AutoNavi Vision в процессе обновления спутниковых изображений от пассивной ссылки до активного обнаружения.

Ключевые элементы спутниковых изображений

По геометрической структуре элементы изображения можно разделить на три категории: дорожные элементы (дорога), наземные элементы (район) и строительные элементы (здание):

дорожный элемент: Включая обычные дороги, мелкие дороги (основные/вспомогательные дороги/полосы для немоторизованных транспортных средств, заранее повернуть направо), точки соединения (сквозные дороги, въезды и выезды, развороты, перекрестки и т. д.).

элемент функции: включая территорию строительства, зону сноса, акваторию, сельскохозяйственные угодья, горную местность, лесной массив, теплицу и т. д.

строительный элемент: Строительные блоки.

Преимущества спутниковых снимков в обновлении данных

Дорожная сеть является основой картографических данных, и все атрибуты дорог, динамические события и рекомендации по POI должны основываться на точных данных данных дорожной сети. Тем не менее, спутниковые снимки имеют глобальную и богатую информационную поддержку для суждения о взаимосвязях связей, сложных взаимосвязях пересечений и уровневых взаимосвязях дорожной сети в регионе из-за перспективы Бога. В то же время, благодаря характеристикам широкого охвата и дешевизне спутниковых снимков, можно очень хорошо дополнить данные дорожной сети для районов с редкой жарой или трудно охватываемых собирающими транспортными средствами.

Три основных источника информации о дорожной сети: тепло, спутниковые снимки, фактическая добыча полезных ископаемых.

В качестве конечной точки пользовательской навигации POI (аббревиатура от «точка интереса», в картографических данных POI может быть домом, магазином, автобусной остановкой и т. д.) очень важна для точности координат положения. Согласно статистике Top1000w в POI AutoNavi, 70% POI должны быть привязаны к зданиям, а точка прибытия POI имеет сильную зависимость от зданий вдоль улицы.

Сильная корреляция между POI и строительными блоками

Изучение и практика технологии распознавания спутниковых изображений

Тонкая семантическая сегментация спутниковых снимков (семантика)

С точки зрения семантической сегментации, чтобы повысить точность алгоритма, мы фокусируемся на сочетании контекстной информации, такой как использование структуры U-Net, ASPP, нелокальных и других структур, которые играют роль в агрегации информации. . В то же время вводится Attention, чтобы усилить внимание сети к заметной области изображения, то есть к категории, связанной с текущей задачей сегментации, что еще больше улучшает эффект.

Структура U-Net

Поскольку семантика изображения изображения относительно проста, а структура относительно фиксирована, семантическая информация высокого уровня и функции низкого уровня очень важны, поэтому мы выбираем U-Net в качестве базовой структуры сети. Кодировщик-декодер понижает дискретизацию в 4 раза + увеличивает в 4 раза соответственно и восстанавливает высокоуровневую карту семантических признаков, полученную кодировщиком, до разрешения исходного изображения.

По сравнению с FCN и Deeplab, U-Net в общей сложности выполнила апсемплинг 4 раза и использовала Skip Connection на одном и том же этапе вместо прямого наблюдения и обратной передачи с потерей семантических признаков высокого уровня, что обеспечивает окончательное восстановление. карта признаков включает в себя больше низкоуровневых признаков, а также позволяет объединять признаки разных масштабов, чтобы можно было выполнять многомасштабное прогнозирование и DeepSupervision. 4-кратное повышение частоты дискретизации также делает карту сегментации более точной для восстановления информации, такой как края.

ASPP

Используются расширенные свертки с разной степенью расширения, а функции объединяются для получения многомасштабных функций и одновременного получения глобальной и локальной информации.

Attention

Обратите внимание на выступающую область изображения и объедините информацию поверхностного слоя U-Net с соответствующим глубоким слоем, чтобы получить параметры внимания, а затем воздействуйте на текущий глубокий слой, чтобы получить окончательный результат. Внимание.

Non-local

Рецептивное поле (локальное) ядра свертки конкретного слоя на исходном изображении ограничено.Нелокальное может добавлять к выходному результату глобальную информацию, кодируя отношения между разными пикселями в пространстве к выходу текущего слоя. Это хорошее решение для ситуации, когда локальная операция не может видеть общую ситуацию и предоставляет более подробную информацию последующим слоям.

Структура U-Net (вверху слева) Внимание (внизу слева) Нелокальная (вверху справа) ASPP (внизу справа)

Сегментация экземпляра стандартного блока изображения (экземпляр)

Существует два основных метода сегментации экземпляров. Первый основан на обнаружении цели. После получения кадра обнаружения цели передний план и фон семантически сегментируются в кадре. Поскольку этот метод требует помощи предложения области в обнаружении цели, вызывается метод Для метода на основе предложений.

Другой подход заключается в кластеризации пикселей в разных экземплярах на основе карты семантической сегментации, который называется методом Proposal-Free. Мы провели сравнительный эксперимент на двух основных методах.Из-за разнообразия и «коренастой структуры» строительных блоков эффект метода на основе предложений лучше, чем у метода без предложений.

Для данных стандартных блоков важным содержанием выражения является базовая позиция и форма стандартного блока. Однако из-за проблемы угла съемки изображения некоторые высотные здания визуально наклонены, а края некоторых оснований заблокированы, что создает большие трудности для идентификации.

После анализа данных и расчета мы обнаружили, что форма основания большинства блоков совпадает с формой крыши, поэтому мы приняли многозадачную схему обучения сегментации крыши + смещение крыши к основанию. Форма крыши плюс вектор смещения от крыши к основанию могут идеально восстановить форму и положение основания.

Отображение эффекта многоэлементного распознавания

В соответствии с особенностями изображения и взаимосвязями топологической структуры различных элементов спутниковых изображений мы разработали несколько моделей распознавания, включая обычное распознавание дорог, распознавание мелкой дорожной сети, распознавание классификации признаков, распознавание строительных блоков и т. д., которые воздействуют на различные типы данные из AutoNavi.

Обычное распознавание дорог (вверху слева) Точное распознавание дорог (вверху справа) Классификация объектов (внизу слева) Распознавание стандартных блоков (внизу справа)

Будущие перспективы и вызовы

Точное/быстрое обновление данных дорожной сети

Пользователи могут столкнуться с некоторыми сценариями в процессе использования навигации: например, почему для навигации есть новая дорога, а объезд? Зачем идти по дороге, которая больше не доступна? Почему здесь можно развернуться, но для разворота нужно пройти еще несколько километров? Эти навигационные отклонения, вызванные ошибками данных дорожной сети, являются основными проблемами, которые нам необходимо решить в будущем, а также сложными проблемами для отрасли. В будущем мы рассчитываем быстро воспринимать изменения в дорожной сети в реальном мире за счет оптимизации на уровне визуального алгоритма, за счет объединения и прогнозирования нескольких источников сбора данных, а также за счет ряда средств, таких как предварительное обнаружение строящихся дорог. .

Строительные блоки и строительство AOI в цифровом городе

Для цифровых городов строительные блоки и AOI (зона интереса) являются одними из важных элементов: если пользователь хочет пойти в магазин, фактической точкой прибытия является здание, в котором расположен магазин; пользователь хочет пойти Для определенного здания в определенном сообществе фактической точкой прибытия навигации является вход в сообщество, поэтому точность и полнота строительного блока и AOI напрямую влияют на опыт пользователя на последних нескольких сотнях метров навигации. В то же время, в сочетании с недавней профилактикой и контролем эпидемий, строительные блоки и информация о AOI в цифровом городе могут обеспечить надежную поддержку данных для предотвращения эпидемий и борьбы с ними в офисных зданиях и жилых районах. Мы надеемся, что в будущем, объединив возможности обнаружения спутниковых изображений, мы еще больше улучшим построение данных о цифровых городах, соединим реальный мир и улучшим путешествия.