Это 24-й день моего участия в августовском испытании обновлений. Узнайте подробности события:Испытание августовского обновления
Всего вокруг кузова Tesla установлено 8 камер, во время вождения вокруг кузова устанавливается 8 камер для сбора информации об изображении, а использовать можно только 7 из них, т. к. одна из камер, установленных под номерным знаком, используется для парковки , реверсивное изображение.
- За лобовым стеклом установлена тринокулярная камера переднего обзора, включающая камеру переднего обзора широкого обзора, камеру основного обзора и камеру узкого обзора (узкую).
- На стойке две камеры, в основном смотрящие в сторону и вперед, две камеры установлены в положении средней стойки, что является разделением между передней и задней дверью.Камера установлена на этой черной части
- На поворотниках с обеих сторон автомобиля установлены две камеры для наблюдения за задней частью автомобиля, фактически с обеих сторон переднего крыла автомобиля.
Поля обзора этих камер перекрывают друг друга, чтобы гарантировать отсутствие слепых зон при движении автомобиля.Помимо передней тринокулярной камеры, остальные четыре камеры в основном гарантируют функции уровня L3 Tesla: смена полосы движения, слияние и выезд на высокой скорости. На реальных фотографиях видно, что соседние левая и правая полосы действительно обслуживаются без тупиков.
Самоуправляемые системы не могут просто использовать обнаружение объектов в пространстве 2D-изображения, им также нужен вид сверху вниз. Традиционный метод заключается в создании трекера занятости для проецирования 2D-изображения в 3D-пространство.Это сшивание состоит в сшивании разных изображений в разные моменты времени.Этот процесс сшивания трекера не учитывает связь изображений во времени, только может создать небольшой местная карта, чтобы помочь машине проехать через парковку).
Однако при сшивке возникает много проблем, поскольку камеры указывают в произвольных направлениях, и сложно выровнять изображения между разными камерами. Очень сложно развиваться. Я пробовал эту проблему сам, и это более сложная задача.
Чтобы обеспечить функцию вызова транспортного средства, транспортное средство или нейронная сеть должны предоставить карту, необходимую для движения транспортного средства.Среди камер вокруг тела ни одна из камер не может видеть все ситуации вокруг транспортного средства, поэтому как интегрировать изображения с этих камер в одно изображение, Прежде всего, это зависит от преимуществ этого. Путем объединения нескольких видов можно получить полную информацию о транспортном средстве. Информация непрерывна и непротиворечива, и полная информация способствует дающие правильные суждения. Существует также более точное предсказание целей. Однако из-за традиционных признаков и извлечения краев по-прежнему сложно сопоставить их для сшивания изображений. Здесь Карпати использует нейронную сеть для обучения сети, которая также является нейронной сетью. Для того, чтобы получить здесь точную информацию, процесс сшивки представляет собой не только пространственную сшивку и сшивку изображений с нескольких камер, но и временную, то есть то, что вы видели в последнюю секунду, что вы видите сейчас, и что вы увидите в в следующую секунду. Я считаю, что благодаря слиянию информации о множестве изображений во времени и пространстве будут получены лучшие результаты, но ключслияние, как интегрировать это ключ.
После того, как информация об изображении собрана 5 камерами, функции извлекаются магистральной сетью, и эти функции объединяются (слияние).
Слой слияния для создания единого представления заключается в объединении всех представлений вместе. Следующий этап — временной.На этом этапе будет несколько последовательных кадров во времени, например, может быть 8 кадров, поэтому вы берете последние 8 кадров для анализа и проверяете эти кадры на согласованность, поэтому у вас есть сеть, которая пересекается. проверяет все эти фотографии. Итак, теперь вы можете видеть движущиеся объекты, вы можете видеть, как машина движется с одного экрана на другой, и это ценная вещь, которую может выводить сеть, не только чтобы найти, что там есть машина, но и чтобы рассказать вам о транспортное средство Направление движения и скорость, с которой движется транспортное средство. Знание информации предыдущего изображения даст вам, где есть пешеходы, где есть дорожные знаки, где есть придорожные знаки и так далее.
Раньше о том, как использовать нейронные сети для обучения птичьего полета (птичьего полета) было только на бумаге. Я чувствую, что успех Теслы заключается в том, чтобы знать, как реализовать эти технологии. Это как-то связано с оценкой Илона Маска. человек, который умеет делать вычитание.Конечно, это неотделимо от большого быка Капасси.Я чувствую, что он довел нейросеть до крайности. Я думаю, что сложность обучения нейронной сети заключается в том, как спроектировать структуру сети и как решить стандартную выборку, то есть как спроектировать структуру данных, а дизайн структуры данных определяет эффект от процесса обучения.
Сеть сети BEV может найти подходящий обучающий набор для обучения всей сети.Сеть может использовать Unet для семантической сегментации.Для ввода сети BEV несколько изображений семантически сегментированы, и эти структуры сливаются, а на выходе получается плоское изображение. На плане этажа реализован эффект отрисовки границ дорог, линий переулков и движущихся объектов на плоскости Эта часть будет развернута и видна позже.