Кратко о EmbedKGQA
Бумага: Улучшение ответа на вопрос с несколькими переходами по сравнению с диаграммами знаний с использованием вложений базы знаний адрес:ACL anthology.org/2020.ACL-лошадь…Исходный код:GitHub.com/mall лаборатория IIS C…
Построение подграфа для поиска ответов на вопросы
Если ребро has_genre(Гангстер №1, Преступление) отсутствует из-за неполноты КГ. Тогда в процессе рассуждений ответ Преступление находится на позиции 4 прыжка.Если поиск подграфа ограничен только 3 прыжками, то в построенном подграфе нет ответа на ответ.
Метод EmbedKGQA
-
Модуль внедрения KG: изучите встраивание всех сущностей из входного KG.В реальном коде используется метод ComplEx, но также реализованы некоторые другие методы KGE, которые можно заменить.
-
Модуль внедрения вопросов: обучение внедрению вопросов, то есть преобразование семантической информации вопроса в вектор.
- В статье после добавления 4 слоев MLP после Роберта функция активации ReLU преобразуется в 768-мерный вектор
- То, что на самом деле написано в коде, — это только 1 слой MLP позади Роберты, и никакая функция активации ReLU не преобразуется в 768-мерный вектор.
-
Модуль выбора ответов: выберите окончательный ответ, объединив оценки сходства вопросов и отношений.
-
Два случая: является ли KG большим или маленьким, ответ выбирается из объектов-кандидатов, сгенерированных при подсчете ответов, в то время как подсчет ответов вычисляет баллы всех объектов в KG, а затем выбирает лучший k в качестве кандидата сущности
-
В случае небольшого KG, поскольку все объекты в KG были внедрены, объект с наивысшим баллом выбирается путем подсчета ответов, а именно top1.
-
В случае большого KG сокращение набора сущностей-кандидатов может повысить производительность, поэтому существует стратегия сокращения, и в коде выбирается оценка top200.
- Сначала вычислите q(вопрос) и оценку всех отношений, если она больше 0,5, добавьте ее в набор отношений-кандидатов R_a.
-
Затем вычислите кратчайший путь от головного объекта к каждому объекту в наборе объектов-кандидатов, сохраните отношение через путь и сгенерируйте набор отношений R_a' (набор отношений — это набор отношений для конкретного объекта-кандидата).
-
Пересечение двух наборов отношений
-
Если пересечение не является пустым множеством, то этот объект-кандидат является ответом
-