[Знающий ответ] · Нейронная сеть для обработки несоответствия входных измерений

искусственный интеллект Python

[Знающий ответ] · Нейронная сеть для обработки несоответствия входных измерений

Содержание этой статьи выбрано из одной из статей автора Zhihu.отвечать, который представляет собой учебное пособие о том, как нейронная сеть обрабатывает несоответствия в размерах входных данных. .

1. Описание проблемы

 

Что делать в нейронной сети, если размеры каждого входа несовместимы?

Что делать в нейронной сети, если размеры каждого входа несовместимы? Рассмотрим группу людей, иногда в команде трое (3 входных нейрона), а иногда в группе четыре (четыре входа).

 

2. Автор отвечает

 

Потому что общая сеть имеет фиксированные требования к размеру ввода. Почему это? Потому что организация и параметры сети определяют необходимость фиксации. Это очень распространенная проблема, возникающая при разработке глубокого обучения.

Есть два пути ее решения:

Один из них — работать с данными и выравнивать данные, что на самом деле очень распространено при распознавании изображений, то есть изменять размер изображения до целевого размера. (224x224 обычно используется в ImageNet). Но такая обработка не подходит для одномерных последовательностей, таких как речь и электрокардиограмма. Для одномерных данных разработчикам необходимо настроить метод.Проще всего сформулировать подходящую длину.Отсекается лишняя часть и заполняется недостающая (метод заполнения тоже нужно хорошо подобрать.Проще всего - добавить нули, и общий метод - скопировать)

Во-вторых, обработка из сетевой структуры. Фактически, все реальные фиксированные параметры являются полностью связанными сетями. CNN и RNN используют настройку общих параметров между слоями. См. «[Глубокое мышление] Почему CNN является синхронным (параллельным) а РНН асинхронный.(последовательный)? 》blog.CSDN.net/Сяо Сун.... Можно обрабатывать входные данные разной длины, но выходная длина определяется входной длиной. На самом деле вам нужно только обработать вывод до фиксированной длины, а затем отправить его на полное соединение. Что можно сделать для выполнения этого требования? Могут быть реализованы глобальные пулы и пирамиды изображений.

Наконец, давайте поговорим о преимуществах и недостатках соответствующих методов.Метод выравнивает данные и может терять функции, но его можно обучать в пакетном режиме, что просто реализовать. Метод 2. Адаптивная сеть немного сложна в реализации, а пакетное обучение также немного проблематично.В настоящее время автор может установить только размер_пакета равным 1.