Углубленная интерпретация Tesla AI DAY (2) - многозадачная нейронная сеть HydraNet

Это 22-й день моего участия в августовском испытании обновлений.Подробности о событии:Испытание августовского обновления

Выше описано, как извлекать признаки разных масштабов на основе магистральной сети и выполнять слияние признаков по масштабам в сети BiFPN, а затем вводить эти признаки в одноэтапную сеть обнаружения целей, аналогичную YOLO для обнаружения одной цели. Конечно, чтобы Тесла прочитал первым

Чтение семантики изображения посредством семантической сегментации, с одной стороны, используется для принятия решений по управлению FSD, а с другой стороны, оно предоставляется пользователям для повышения доверия пользователей к Tesla.

Многомасштабная карта признаков, полученная из исходного изображения через ряд сетей, будет использоваться для различных задач обнаружения, таких как проверка транспортных средств, проверка светофоров и полос движения и т. д. Это многозадачная обучающая сеть. Каждая задача основана на структуре магистральной сети, они имеют одинаковый набор функций, и каждая задача рассматривается как ответвление, выросшее из магистральной сети.

Далее поговорим о том, какие преимущества приносит нам эта сетевая структура.

совместное использование функций

Во-первых, это совместное использование функций, то есть разные задачи используют процесс рассуждения о прямом распространении в магистральной сети, что экономит время тестирования со стороны и эффективно распределяет время тестирования на разные задачи.В Tesla тысячи целей для определения типов. Идентификация, которая экономит время за счет совместного использования характеристик магистральной сети.

Низкая связь между задачами

Несмотря на то, что основные функции являются общими для разных задач, для сравнения настройки разных задач только руководитель задачи должен выполнить тонкую настройку сетевой структуры головы для отдельной памяти задачи. Эта корректировка не повлияет на другие задачи, тем самым достигается низкая связь между задачами.

Слой узкого места кэша

Каждый раз, когда структура сети обновляется путем обновления данных, многомасштабные признаки, извлеченные из обученной магистральной сети, будут кэшироваться на диск, то есть при выполнении точной настройки свойства и параметры этой многозадачной сети обновляется через данные, то есть магистральная сеть будет обновлена.Функции сети не участвуют в обучении тонкой настройке оптимизации. А обучение – этосовместное обучение.

В предыдущих нейронных сетях изображения собирались с помощью одной камеры, а HydraNet обрабатывает одно изображение.Большое количество задач прогнозирования, таких как линии полос движения, транспортные средства, движущиеся по дороге, и дорожные знаки, основаны на информации, предоставленной одно изображение.

Это новая функция Tesla под названием Tesla, которая может отозвать Tesla, припаркованную на стоянке, и самостоятельно переехать к владельцу.Это полностью беспилотная функция, а также предварительный шаг Tesla к полностью беспилотному. Одна из проблем, с которой сейчас сталкивается Тесла, — как себя позиционировать.Сегодня, исходя из этих представлений, транспортное средство не может найти владельца, управляя транспортным средством.

На изображении выше показано, как вышеприведенный вид с высоты птичьего полета сшивается в реальном времени путем обнаружения краев дороги через камеры. На самом деле существует много алгоритмов для обнаружения краев изображения. Например, алгоритм хитрости и преобразование Хафа, представленные ранее, можно использовать для обнаружения линий полосы движения и краев дороги. нужно проходить алгоритм синхронно, добиться такого эффекта непросто. Так что я надеюсь, что все это можно будет сделать внутри нейросети, чтобы не было проблем с обменом данными между разными моделями и обеспечивалась консистентность сети end-to-end сети.

Сшивайте прогнозы бордюров для каждой камеры, для разных камер и времени.

Сложность 1

Слияние кросс-шотов и трекеры трудно писать четко

Сложность 2

Пространство изображения не является правильным выходным пространством

Изображение проходит через нейронную сеть, чтобы получить хорошие результаты обнаружения линий дорожек и краевых линий, и эти края представлены красными и синими линиями на изображении, но когда эти линии отображаются в векторное пространство, возникает беспорядок. Основная причина проблемы в том, что здесь отсутствует информация о пространственной глубине каждого пикселя.

Что касается обнаружения объектов, пересечение разных камер также помогает решить проблему, когда грузовики на дороге появляются в 5 камерах, но проблема в том, что грузовики, появляющиеся ни в одной из камер, не являются полными. Как получить полное распознавание грузовика путем слияния (слияния) по камерам.

Вот два вопроса к вам

Первый вопрос заключается в том, как Тесла вводит информацию о глубине через нейронные сети, чтобы объединить информацию о нескольких изображениях в векторное пространство.
Как использовать камеру для более точного распознавания целей

Поделитесь этой информацией в следующий раз, чтобы дать ответ.