Как сверточные фильтры извлекают особенности изображения

искусственный интеллект Нейронные сети

Добро пожаловать на главный сайт Jizhi:Jizhi, двигатель, ведущий к эре интеллекта




в предыдущемСвертка: Как стать очень мощной нейросетью — знай колонку, восторженные пользователи сети задали следующие вопросы:

В этой статье интуитивно объясняется состав сверточной нейронной сети, но не обсуждаются математические принципы. В этой статье будет подробно представлен конкретный механизм фильтра свертки.Конечно, не беспокойтесь о математических проблемах, если вы можете освоить сложение и вычитание в пределах 100 и таблицу умножения 99.

В предыдущем обсуждении нейронных сетей на Weibo тема пошла странно (планирование), и Ван Ситу тоже дал обещание вызвать Юки Кашиваги, поэтому в этот раз я возьму для примера фото Юки Кашиваги.Объясню основы обработки изображений.


01. Тайное наблюдение

Сейчас «искусственный интеллект», о котором мы говорим, — это слабый искусственный интеллект, точнее, вспомогательные вычислительные средства. Мы не можем перестать думать как Кац из-за нейронных сетей.

Поэтому, какую бы проблему вы ни решили с помощью нейронной сети, первым и самым важным шагом будет понимание вашей проблемы. Отраженный в конкретных приложениях, он заключается в том, чтобы выяснить логическую взаимосвязь, стоящую за бизнесом, вместо того, чтобы выбрасывать данные в черный ящик и начинать готовиться к алхимии. Если вы не можете понять это, коснитесь его снова.

Теперь мы собираемся сделать программу распознавания объектов.На картинке выше не так много объектов для распознавания. В качестве вводной программы нерационально и нецелесообразно заниматься цветными картинками так рано. Таким образом, мы должны сделать некоторые упрощения, отделить фазу костей от фазы кожи, раскрыть самые основные математические принципы и поместить Play.

После двух шагов «оттенки серого -> порог» цветное изображение становится черно-белым. Далее нам нужно обратиться к Ситу с точки зрения компьютерного зрения, поэтому черное перед нами не черное, а белое, о котором вы говорите, не белое.


02. Увидеть микрознание

Отложив на время фон изображения, после наблюдения мы можем видеть, что для идентификации с человеческим телом, по сути, нужно найти черноту из белых цветов, на самом деле, это найти 1 из 0. .

Так нужно ли нам это исправлять? Нет, вам нужно только обнаружить край. Это как игра в шахматы. Золотой рог и серебряный край - это гнилое брюхо. Пока глаза окружены, ци будет занята, а импульс будет контролироваться.

Фильтр свертки представляет собой матрицу меньше размера изображения, здесь он установлен на 3x3. Мы масштабируем изображение до уровня пикселей (угадайте, какая это часть), где за каждым маленьким квадратиком стоит 0 или 1. Ядро свертки перекатывается и трется вперед и назад по входному изображению, после чего в основном встречаются три области (оранжевые прямоугольники):

Соответствующая связь со следующим рисунком также должна быть очевидной.

В это время наше ядро ​​свертки похоже на перышко, подметающее каждый уголок.

03. Подсчет

На приведенной выше диаграмме мы видели множество фильтров и соответствующих эффектов фильтров, таких как обнаружение краев, повышение резкости, среднее размытие, размытие по Гауссу.

Давайте посмотрим на третье ядро ​​свертки обнаружения ребер, матрица которого:


-1 -1 -1

-1  8 -1

-1 -1 -1

Затем возьмите область 5x5, содержащую ребро, соответствующую матрице:


0 0 1 1 1

0 0 1 1 1

0 0 1 1 1

0 0 1 1 1

0 0 1 1 1

Теперь эту матрицу 3х3 (фильтр) нужно коснуться на матрице 5х5, конечно, не ради забавы, а для вычисления значения. Метод расчета показан на рисунке ниже.Желтый квадрат и красное число — это сверточные фильтры, а метод расчета заключается в умножении перекрывающихся соответствующих элементов и последующем их сложении. (Примечание: это не настоящее «умножение матриц»)

Поскольку изображение здесь не меняется по вертикали, необходимо позволить фильтру скользить только на один круг вдоль верхнего конца.Всего есть три вычисления:

1

2

3

Итоговая полная карта объектов будет выглядеть так:

Положение единицы карты признаков соответствует положению центра ядра свертки (8) Есть три значения карты признаков.

Теперь вы должны понять, почему фильтры могут извлекать функции из изображений.

Задавайте вопросы, общайтесь в комментариях или переходите наСообществопост для обмена.