Во-первых, свертка трехмерных изображений RGB
Сначала просмотрите процесс следующей двумерной операции свертки:
Затем давайте посмотрим, как 3D-изображения могут выполнять эффективные операции свертки.
Метод расчета аналогичен двумерной свертке, которая делится на трехмерное изображениеблоки (так называемыеКуб свертки), свернуть 27 пикселей, то есть умножить и суммировать с фильтром поэлементно, чтобы получить значение в выходной двумерной матрице.
3D-изображения и фильтры могут иметь разную высоту и ширину, но должны иметьодинаковое количество каналов. В примере RGB есть три цветовых канала, RGB (которые составляют любой цвет в изображении).
2. Фильтр наложения
Рассмотрим вопрос: обнаружение вертикальных и горизонтальных краев может быть достигнуто с помощью предыдущего метода, но что, если мы хотим обнаружить более общие края (другими словами: хотим обнаружить больше информации об объектах)? Вроде 43°. В настоящее время необходим метод, называемый наложением фильтра.
- Используйте фильтр обнаружения вертикального края, чтобы получить результат обнаружения вертикального края [2D].
- Используйте фильтр обнаружения горизонтального края, чтобы получить результат обнаружения горизонтального края [2D].
- Наложите матрицы обнаружения вертикальных и горизонтальных краев, чтобы получить результат [3D].
- Этот [3D] результат накладывает эффекты вертикального и горизонтального обнаружения.
Давайте посмотрим на схему учителя:
Три, сводка параметров
3D изображение:фильтр:Выход свертки:в, #Обратите внимание, что здесь используются padding=valid и stride=1. Таким образом, более общий вывод свертки выглядит следующим образом:Количество выходных каналовравно количеству фильтров, которое также равно количеству обнаруженных признаков (в приведенном выше примере изображения RGB обнаруживаются как вертикальные, так и горизонтальные края)
4. Однослойная сверточная сеть
Подсчитайте количество параметров в однослойной сетиИзображение в один слой, количество фильтров 10, сколько параметров у этого слоя?
- Каждая позиция 27, операции свертки плюс значение смещения B, чтобы получить желаемую свертка 28 каждого параметра фильтра.
- Всего есть 10 фильтров, в 10 раз выше процесс, всего 280 параметров.
Видно, что каким бы большим ни было изображение, параметров не так много, в зависимости от количества и размера фильтров, что вызывается в сверточной нейронной сетиизбегать переоснащения.
5. Описание символа
: первоеразмер фильтра слоя
: первоеКоличество отступов в слое
: первоеРазмер шага слоя
: первоеКоличество фильтров для слоя
: первоеИзмерение фильтра слоя
: первоеВесовой размер слоя
: первоеРазмер смещения слоя
: первоевходной размер слоя
: первоевыходной размер слоя
: первоеВыходной размер слоя [m отсчетов] (методы векторизации в глубоком обучении)
Шесть, сверточная нейронная сеть для классификации изображений
Первая свертка:Вторая свертка:
Третья свертка:
Разверните последний результат свертки в столбец векторов и регрессию логистики/softmax, чтобы получить результат прогнозирования.
7. Типичные типы слоев в сверточных нейронных сетях
- Сверточный слой Convolution (CONV)
- Пулирующий слой Объединение в пул (POOL)
- Полностью подключенный слой Полностью подключенный (FC)
Хотя сверточные нейронные сети могут быть реализованы путем создания только сверточных слоев, архитекторы нейронных сетей обычно строят нейронные сети с верхними объединяющими слоями и полностью связанными слоями, которые легче построить, чем сверточные слои. Сочетание этих трех может создать более мощную нейронную сеть.