Аннотация: В области извлечения информационной структуры предшественникам обычно необходимо завершить извлечение информационной структуры на основе аннотированных вручную шаблонов. В этой статье предлагается решение на основе сверточной сети с нулевым выстрелом, которое может решить проблему, связанную с тем, что обучающая выборка и тестовая выборка поступают из разных вертикальных доменов.
Эта статья опубликована в сообществе HUAWEI CLOUD.«Шестнадцатая серия интерпретаций документов: структурированное извлечение информации в сценарии нулевого выстрела», Автор: Очаруйте улыбкой.
В области извлечения информационной структуры предшественникам обычно необходимо завершить извлечение информационной структуры на основе вручную аннотированных шаблонов. В этой статье предлагается решение на основе сверточной сети с нулевым выстрелом, которое может решить проблему, связанную с тем, что обучающая выборка и тестовая выборка поступают из разных вертикальных доменов.
Рис. 1. Источники данных для обучения и логического вывода — разные вертикали.
определение проблемы
Рис. 2. Интуитивное понимание OpenIE и ClosedIE.
Relatin Extraction
- Close Relation Extraction (ClasedIE)
R_R_ представляет собой набор категорий, включая отсутствие категории, и модель может напрямую назначать категорию каждому объекту.
- Open Relation Extraction(OpenIE)
R_R_ представляет собой набор категорий, а модель классифицирует две категории, чтобы определить, является ли одна сущность ключом другой сущности.
Zero-Shot Extraction
Zero-Shot можно отличить по сложности следующим образом:
- Unseen-Website Zero-shot Extraction
То есть разные макеты в одной вертикали, например, это все страницы из фильмов. Просто макет веб-страницы, используемый в тесте на вывод, отличается от тренировочного.
- Unseen-Websiste Zero-shot Extraction
То есть разные макеты в разных вертикальных полях.Например, обучение идет со страницы фильма, а тест рассуждений может использовать веб-страницу рекрутингового сайта.
Решение, предложенное в этой статье, фактически состоит в том, чтобы обнаружить все пары ключ-значение в сети графа, Поскольку задача обнаружения ключей-значений не зависит от формата, она играет роль в анализе структуры междоменного формата.
концепция
-
отношение: относится к ключу
-
объект: относится к значению
-
отношение: относится к ключу -> значение
Кодировщик (построение функций)
Построение информации об узле завершается графом G_G_, включающим ряд узлов N_N_ (сущностей) и ребер E (ребер) между узлами.
Создавайте отношения между сущностями на основе правил проектирования
Ребра между узлами строятся в следующих случаях (пары ключ-значение часто располагаются сверху вниз или слева направо):
-
Горизонтальный случай: горизонтальные соседи, а других узлов посередине нет;
-
Вертикальный случай: вертикальные соседи без других узлов между ними;
-
Ситуация того же уровня: одноранговый узел;
Используйте графовые сети для моделирования отношений между сущностями
На основе Graph Attention Network (GAT) для моделирования отношений узлов начальные (входные) функции узла:
-
Визуальные возможности: визуальные описания классов узлов на веб-страницах;
-
Текстовые функции: OpenIE усредняет характеристики предварительно обученного Bert, а CloseIE подсчитывает частоту появления строки узла (похоже, это более дружелюбно к кросс-домену);
Предтренировочный механизм
В статье разработана вспомогательная функция потерь L_{pre}_Lpre_для наблюдения за тремя категориями классификации: {ключ, значение, другое}. При этом, для предотвращения переобучения в процессе обучения, веса сети графов в задаче OpenIE не будут обновляться после завершения предобучения.
Сеть прогнозирования отношений
OpenIE
Определите, удовлетворяет ли пара узлов содержимому строки первого узла ключ содержимого строки второго узла:
-
Используйте алгоритм идентификации пары кандидатов, чтобы получить потенциальные пары строк;
-
Исходные входные характеристики двух узлов + выходные характеристики GNN + признаки взаимосвязи двух узлов используются в качестве входных данных классификатора;
-
Полностью подключенная сеть для классификации;
ClosedIE
Кросс-энтропийная многоклассовая классификация
эксперимент
- Это правда, что междоменные задачи сложнее.
- CloseIE: Это правда, что чем больше URL-адресов, тем лучше эффект.
- Подтвердите влияние различных факторов на производительность сетевой модели.
Нажмите «Подписаться», чтобы впервые узнать о новых технологиях HUAWEI CLOUD~