[Знающий ответ] · Нейронная сеть для обработки несоответствия входных измерений
Содержание этой статьи выбрано из одной из статей автора Zhihu.отвечать, который представляет собой учебное пособие о том, как нейронная сеть обрабатывает несоответствия в размерах входных данных. .
1. Описание проблемы
Что делать в нейронной сети, если размеры каждого входа несовместимы?
Что делать в нейронной сети, если размеры каждого входа несовместимы? Рассмотрим группу людей, иногда в команде трое (3 входных нейрона), а иногда в группе четыре (четыре входа).
2. Автор отвечает
Потому что общая сеть имеет фиксированные требования к размеру ввода. Почему это? Потому что организация и параметры сети определяют необходимость фиксации. Это очень распространенная проблема, возникающая при разработке глубокого обучения.
Есть два пути ее решения:
Один из них — работать с данными и выравнивать данные, что на самом деле очень распространено при распознавании изображений, то есть изменять размер изображения до целевого размера. (224x224 обычно используется в ImageNet). Но такая обработка не подходит для одномерных последовательностей, таких как речь и электрокардиограмма. Для одномерных данных разработчикам необходимо настроить метод.Проще всего сформулировать подходящую длину.Отсекается лишняя часть и заполняется недостающая (метод заполнения тоже нужно хорошо подобрать.Проще всего - добавить нули, и общий метод - скопировать)
Во-вторых, обработка из сетевой структуры. Фактически, все реальные фиксированные параметры являются полностью связанными сетями. CNN и RNN используют настройку общих параметров между слоями. См. «[Глубокое мышление] Почему CNN является синхронным (параллельным) а РНН асинхронный.(последовательный)? 》blog.CSDN.net/Сяо Сун.... Можно обрабатывать входные данные разной длины, но выходная длина определяется входной длиной. На самом деле вам нужно только обработать вывод до фиксированной длины, а затем отправить его на полное соединение. Что можно сделать для выполнения этого требования? Могут быть реализованы глобальные пулы и пирамиды изображений.
Наконец, давайте поговорим о преимуществах и недостатках соответствующих методов.Метод выравнивает данные и может терять функции, но его можно обучать в пакетном режиме, что просто реализовать. Метод 2. Адаптивная сеть немного сложна в реализации, а пакетное обучение также немного проблематично.В настоящее время автор может установить только размер_пакета равным 1.