Во-первых, свертка трехмерных изображений RGB

Сначала просмотрите процесс следующей двумерной операции свертки:

在这里插入图片描述 Затем давайте посмотрим, как 3D-изображения могут выполнять эффективные операции свертки.Метод расчета аналогичен двумерной свертке, которая делится на трехмерное изображение $3\times3\times3$ блоки (так называемыеКуб свертки), свернуть 27 пикселей, то есть умножить и суммировать с фильтром поэлементно, чтобы получить значение в выходной двумерной матрице. 在这里插入图片描述 3D-изображения и фильтры могут иметь разную высоту и ширину, но должны иметьодинаковое количество каналов. В примере RGB есть три цветовых канала, RGB (которые составляют любой цвет в изображении).

2. Фильтр наложения

Рассмотрим вопрос: обнаружение вертикальных и горизонтальных краев может быть достигнуто с помощью предыдущего метода, но что, если мы хотим обнаружить более общие края (другими словами: хотим обнаружить больше информации об объектах)? Вроде 43°. В настоящее время необходим метод, называемый наложением фильтра.

Используйте фильтр обнаружения вертикального края, чтобы получить результат обнаружения вертикального края [2D].
Используйте фильтр обнаружения горизонтального края, чтобы получить результат обнаружения горизонтального края [2D].
Наложите матрицы обнаружения вертикальных и горизонтальных краев, чтобы получить результат [3D].
Этот [3D] результат накладывает эффекты вертикального и горизонтального обнаружения.

Давайте посмотрим на схему учителя: 在这里插入图片描述

Три, сводка параметров

3D изображение: $n\times n\times n_c$ фильтр: $f\times f\times n_c$ Выход свертки: $n-f+1\times n-f+1\times n_c'$ в, $n_c'=$ # $filters$ Обратите внимание, что здесь используются padding=valid и stride=1. Таким образом, более общий вывод свертки выглядит следующим образом: $\frac{n+2p-f+1}{s}\times \frac{n+2p-f+1}{s}\times n_c'$ Количество выходных каналов $n_c'$ равно количеству фильтров, которое также равно количеству обнаруженных признаков (в приведенном выше примере изображения RGB обнаруживаются как вертикальные, так и горизонтальные края)

4. Однослойная сверточная сеть

在这里插入图片描述 Подсчитайте количество параметров в однослойной сетиИзображение в один слой $3\times3\times3$ , количество фильтров 10, сколько параметров у этого слоя?

Каждая позиция 27, операции свертки плюс значение смещения B, чтобы получить желаемую свертка 28 каждого параметра фильтра.
Всего есть 10 фильтров, в 10 раз выше процесс, всего 280 параметров.

Видно, что каким бы большим ни было изображение, параметров не так много, в зависимости от количества и размера фильтров, что вызывается в сверточной нейронной сетиизбегать переоснащения.

5. Описание символа

$f^{[l]}$ : первое $l$ размер фильтра слоя

$p^{[l]}$ : первое $l$ Количество отступов в слое

$s^{[l]}$ : первое $l$ Размер шага слоя

$n_c^{[l]}$ : первое $l$ Количество фильтров для слоя

$f^{[l]}\times f^{[l]}\times n_c^{[l-1]}$ : первое $l$ Измерение фильтра слоя

$f^{[l]}\times f^{[l]}\times n_c^{[l-1]}\times n_c^{[l]}$ : первое $l$ Весовой размер слоя

$n_c^{[l]} :1\times1\times1\times n_c^{[l]}$ : первое $l$ Размер смещения слоя

$n_{H}^{[l-1]}\times n_{W}^{[l-1]}\times n_c^{[l-1]}$ : первое $l$ входной размер слоя

$n_{H}^{[l]}\times n_{W}^{[l]}\times n_c^{[l]}$ : первое $l$ выходной размер слоя

$m\times n_{H}^{[l]}\times n_{W}^{[l]}\times n_c^{[l]}$ : первое $l$ Выходной размер слоя [m отсчетов] (методы векторизации в глубоком обучении)

$n_{H}^{[l]}=\lfloor{\frac{n_{H}^{[l-1]}+2p^{[l]}-f^{[l]}}{s^{[l]}}+1}\rfloor$

$n_{W}^{[l]}=\lfloor{\frac{n_{W}^{[l-1]}+2p^{[l]}-f^{[l]}}{s^{[l]}}+1}\rfloor$

Шесть, сверточная нейронная сеть для классификации изображений

Первая свертка: 在这里插入图片描述 Вторая свертка:Третья свертка:Разверните последний результат свертки в столбец векторов и регрессию логистики/softmax, чтобы получить результат прогнозирования. 在这里插入图片描述

7. Типичные типы слоев в сверточных нейронных сетях

Сверточный слой Convolution (CONV)
Пулирующий слой Объединение в пул (POOL)
Полностью подключенный слой Полностью подключенный (FC)

Хотя сверточные нейронные сети могут быть реализованы путем создания только сверточных слоев, архитекторы нейронных сетей обычно строят нейронные сети с верхними объединяющими слоями и полностью связанными слоями, которые легче построить, чем сверточные слои. Сочетание этих трех может создать более мощную нейронную сеть.