Обнаружение объектов\Основы обнаружения целей

машинное обучение

Скелет обнаружения объектов

Большинство алгоритмов обнаружения объектов реализуютпервый шагобычно черезСверточная нейронная сеть CNNОбработайте входное изображение выходного изображения, сгенерируйте относительно глубокую карту признаков, а затем используйте различные алгоритмы для расчета полной точности и потерь.

Обнаружение объектов ----- Нейронная сеть с прямой связью

Обнаружение объектов обычно использует нейронную сеть с прямой связью с глубокой структурой, которая включает вычисления свертки.Нейронные сети с прямой связью включают широко используемыеСверточный слой, объединяющий слой, полносвязный слойЖдать.

сверточный слой

Свертка — это форма операции, которая извлекает характеристики данных с помощью параметров ядра свертки и получает результат с помощью операций умножения и суммирования точек матрицы. Операция сверткиЛинейная операция, чтобы соответствовать нелинейным результатам нейронной сети, поэтому добавьте функции активации, такие как сигмоид, RelU, tanh и т. д.

Шкала параметров сверточного слоя фиксирована независимо от размера входного изображения.

объединяющий слой

Метод понижающей дискретизации (уменьшение изображения), также известный как объединение или операция объединения.

Цель субдискретизации:1. Подгоните изображение под размер области отображения 2. Создайте миниатюру соответствующего изображения

С помощью операции свертки мы завершили уменьшение размерности и извлечение признаков входного изображения, но размер изображения признака все еще очень высок.

Конкретная реализация слоя пулаПосле выполнения операции свертки полученное изображение признака разбивается на блоки, изображение разбивается на непересекающиеся блоки, вычисляется максимальное значение или среднее значение в этих блоках и получается объединенное изображение.

Роль объединяющего слоя:

  1. Уменьшите размерность, уменьшите размер модели и увеличьте скорость вычислений.
  2. Уменьшите вероятность переобучения и улучшите надежность извлечения признаков.
  3. Нечувствителен к перемещению и вращению

полносвязный слой

Обычно он связан с выходной картой объектов сверточной сетью и выводит одномерный вектор.Основные функции:Карта объектов, абстрагированная сверточным слоем, дополнительно отображается наПространство метки для определенного размера, потеря является результатом прогноза.

URL:blog.CSDN.net/Airline bit/Ariti…

В этой статье довольно популярно понимание этих уровней.

Технология обнаружения объектов ----- Разработка структуры сети

  • AlexNet ---> меньшее ядро ​​свертки, более глубокая структура сети ---> VGGNet

  • VGGNet ---> Решите явление, при котором количество параметров значительно увеличивается, а градиент исчезает, вызванный более глубокой структурой сети ---> начало

  • начало ---> Устранение плохой корреляции градиента, возвращаемой структурой глубокой сети ---> ResNet (остаточная сеть остаточной сети)

  • ResNet ---> Оптимизация параметров и суммы расчета ---> DenseNet

  • Пирамида изображения (входное изображение преобразуется в многомасштабное, изображения разного масштаба генерируют признаки разного масштаба) ---> решение многомасштабных задач, извлечение многомасштабных признаков ---> пирамида признаков FPN