Кратко о PullNet
Бумага: PullNet: Ответы на открытые вопросы предметной области с итеративным поиском по базам знаний и тексту
адрес:АР Вест V.org/ABS/1904.09…
Исходный код: нет исходного кода
предложить фон
Большая БЗ не может полностью хранить все знания, поэтому БЗ является неполной. Корпус обычно хранит знания в относительно полной форме, но он не так структурирован, как БЗ. Заданный вопрос — это не простой одношаговый ответ, а многошаговый вопрос, требующий рассуждений.
PullNet сочетает в себе как базу знаний, так и корпус, и использует итеративный подход для построения конкретных подграфов, содержащих информацию, связанную с проблемой. Исходя из вопроса и сущностей, содержащихся в вопросе, строится разнородный подграф (включая связанные текстовые узлы и тройные узлы).Каждая итерация вычисляет вероятность расширения каждого узла в соответствии с GCN и выбирает k узлов, превышающих порог для расширения. . Затем для выбранных k узлов извлеките связанные с ними документы, объекты и тройки, обновите их до построенного подграфа и, наконец, используйте аналогичный GCN, чтобы получить ответ после T итераций.
конкретный метод
Background
для конкретных проблем, чей проблемный подграф. Подграф задачи содержитНеоднородные графы связанных корпусов текстов и информации, связанной с базой знаний.являются узлами в графе.
Есть три вида узлов:
-
: узел объекта,, сущность в КБ
-
: текстовый узел,, документ в корпусе, содержащий последовательность токенов:, документ представляет собой всего одно предложение, и его можно найти непосредственно через объект упоминаний.
-
: узел факта,, утраивается в КБ, включая головную сущность, хвостовую сущность и связь.
это ребро между узлами:
-
Если узел сущностиузел связанного факта,Такэто узел фактаГоловной объект или хвостовой объект .
-
Если узел сущностисвязанные текстовые узлы, то текступомянуть об этом объекте.
алгоритм
-
Диаграмма проблемы инициализации в начале., список сущностей для вопроса в вопросе.это пустое множество.
-
повторятьраз, каждый раз, когда вы выбираетеКаждая сущность дополняется, и на каждой итерации для выбранной сущности извлекается соответствующий текстовый набор и набор фактов.
-
В конце каждой итерации в проблемный граф добавляются новые ребра.. иПосле субитеративного расширения в конце добавляется этап классификации для определения ответа на графе вопросов.
Тяговая операция
Простая вытяжка:
-
: извлечение всех упоминаний из текста.
-
: извлечение объектов головы и хвоста из троек.
Сложная поисковая тяга:
-
: В его бумажном методе все документы могут быть получены путем связывания объектов, то есть два объекта A и B упоминаются в предложении, а затем предложение может быть получено напрямую с использованием A и B в качестве индекса. В дополнение к сущности можно напрямую получить текст, а также ранжировать текст и вопросы.Сходство IDF с , вы, наконец, можете получить вершинутекстовые предложения.
-
: Получить и объект в КБСвязано с тем, чтобы попасть в топузел факт. Ограничьте узлы фактов вДолжна быть его головная сущность или хвостовая сущность, то есть получить сущность в БЗПодграф с одним переходом и отношение между узлами факта рангаи вопросподобие, основанное на формуле.
- связьВложение,проблемапоследовательность слов. Сходство - это преобразование LSTMПредставление последнего уровня и отношениеСкалярное произведение вложений. Затем введите в формулу сигмовидной, чтобы получить вероятность.
Классифицировать операцию
Два типаОперации находятся в подграфахВычисления выполняются на узлах графа (вычисления продолжаются только на сущностных узлах графа). Использование графа CNN, поэтому даже если учитываются только узлы сущностей, некоторые узлы и ребра, не являющиеся сущностями, могут повлиять на окончательный результат классификации.
-
: получить узел объектаВероятность расширения на следующей итерации. Фаза построения подграфа, на каждой итерации выберите толькоузел с наибольшей вероятностью.
-
: После построения подграфа вычислить, может ли узел сущности ответить на вопрос, и сущность с наибольшей вероятностью является окончательным ответом.
-
GraftNet: все вышеперечисленные операции классификации рассчитываются GraftNet, который является вариантом графа CNN.
операция обновления
Приведите график, полученный на предыдущей итерацииДобавить физический узел, текстовый узел, а узел факта. И обновите ребра, соединяющие узлы.
тренироваться
Во время обучения задаются пары вопросов и ответов, где путь вывода неявный. Обучение состоит из вышеперечисленныхоперация и расчет подобия.
Во время обучения, учитывая пару вопросов и ответов, сначала найдите кратчайший путь от сущности вопроса к сущности ответа в базе знаний, а сущности, через которые проходит путь, помечаются какпромежуточные объекты-кандидаты. Для каждого промежуточного объекта-кандидата запишите его кратчайший путь к проблемному узлу..
-
вобучение в следующей итерации, эти положительные примерыподключен к потенциальному промежуточному объекту, а расстояние равно
-
Положительное отношение также к промежуточному объекту-кандидатурасстояние
-
Таким образом, при извлечении больше внимания уделяется узлам кратчайшего пути к ответу.
Извлекайте все узлы сущностей во время обучения, пока их прогнозируемые оценки превышают заданный порог., а не только k узлов с наивысшей оценкой. В процессе обучения, если операция извлечения не получает промежуточный объект-кандидат, он все равно добавляется в граф сам по себе.
Т и порогВсе являются гиперпараметрами, и T должен быть больше или равен максимальной длине цепочки деривации.