Введение в сиамскую сеть

искусственный интеллект

0. Пишите впереди

Такие задачи, как «сопоставление», имеют широкий спектр сценариев применения, например, сопоставление текста в НЛП и отзыв элементов в поле рекомендаций. В результате научные круги и промышленность предложили множество различных методов и моделей для решения проблемы сопоставления и стремятся улучшить эффект. В этой статье представлена ​​​​классическая сетевая модель, сиамская сеть (двойная нейронная сеть), которая может решать, но не ограничивается проблемами «сопоставления».

Личный опыт:

  1. В сиамской сети два входа совместно используют слой кодирования (слой внедрения);
  2. Настраивая слой преобразования признаков и функцию потерь сиамской сети, ее можно адаптировать к различным задачам.

Wikipedia:

Эн. Wikipedia.org/wiki/SI Ames…

1. Архитектура модели

Архитектура модели Siamese Network показана на рисунке. Можно видеть, что идея дизайна модели очень согласуется с интуитивным ощущением «соответствия», то есть входная пара пересекается через преобразование признаков для получения оценки (например, сходства).

Всю модель можно разделить на три этапа:

  1. Входная пара подается в кодировщик для получения закодированного векторизованного представления. Следует отметить, что в сиамской сети входная пара имеет общие параметры кодировщика.Независимо от того, в процессе обучения или тестирования, есть только один набор кодировщиков, и все входы являются общими.
  2. Комбинация и пересечение векторных объектов. Цель этого шага — позволить модели изучить «совпадающие» признаки входной пары и получить скрещенный вектор признаков;
  3. Вектор признаков предыдущего шага отправляется на слой отображения признаков, а функция потерь разрабатывается таким образом, чтобы модель могла выполнить указанную задачу.

2. Пример сопоставления текста сиамской сети

В этом разделе мы берем задачу сопоставления текста НЛП в качестве примера, чтобы представить идею дизайна сиамской сети. Пример дизайна сиамской сети для сопоставления текста показан на рисунке ниже.

Мы видим, что входным слоем модели является пара предложений, которая должна быть сопоставлена.После преобразования тем же кодировщиком получается вектор кодирования признаков встраивания. Кроме того, два вектора внедрения интерактивно объединяются и, наконец, отправляются на полностью связанный уровень для получения результата предсказания классификации. На самом деле, абстрагируясь, в задаче сопоставления текста сиамская сеть может быть разобрана на, преобразовать входные данные в одно и то же пространство признаков, затем выполнить сопоставление векторного взаимодействия (аналогично косинусному сходству) и, наконец, выполнить преобразование признаков, чтобы модель могла научиться для разных разных параметров задачи.

3. Резюме

В этой статье мы представляем идеи и принципы проектирования сиамской нейронной сети Siamese Network и объясняем их в сочетании с сопоставлением текста. Сиамская сеть имеет простой принцип и широкий спектр приложений и может использоваться в качестве хорошей базовой модели для многих сценариев.