[График знаний] 1.3-Как сделать График знаний?

Как делать карту знаний, конечно, в двух словах не понятно. Прежде всего, вы должны сначала думать, исходя из собственного бизнеса.Вот несколько основных путей построения графов знаний.

логичная идея построения

1. Разберитесь с бизнесом и постройте онтологию: нужно ли вам использовать граф знаний? Какова стоимость и каков эффект? Способен ли он построить граф знаний? Могут ли данные, команда и т. д. поддержать это? Если необходимо, как отсортировать набор онтологических фреймворков в соответствии с бизнесом?
2. Отредактируйте онтологию и задайте структуру представления бизнес-знаний: Protege можно использовать для редактирования онтологии, чтобы получить файл представления знаний, представленный OWL.
3. Дополните онтологию примерами данных: сначала найдите несколько примеров данных, чтобы облегчить понимание.

Различные способы построения

Метод построения сверху вниз: сначала определите онтологию и схему данных, а затем добавьте сущность в базу знаний. Используйте некоторую существующую структурированную базу знаний в качестве базовой базы знаний.
Метод построения снизу вверх: извлечение объектов из некоторых данных открытых ссылок, выбор объектов с более высокой степенью достоверности и добавление их в базу знаний, а затем построение онтологической модели верхнего уровня.

Ключевые технологии в строительном процессе

Обычно он включает пять аспектов: извлечение знаний, представление знаний, объединение знаний, обработку знаний и оценку знаний.
С помощью технологии извлечения знаний элементы знаний, такие как сущности, отношения и атрибуты, могут быть извлечены из данных некоторых открытых полуструктурированных, неструктурированных и структурированных сторонних баз данных.
Представление знаний представляет элементы знаний через определенные эффективные средства, удобные для дальнейшей обработки и использования. Комплексный вектор, сформированный распределенным представлением знаний, имеет большое значение для построения, рассуждения, объединения и применения базы знаний.
Затем посредством слияния знаний неоднозначность между сущностями, отношениями, атрибутами и другими референтами и объектами фактов может быть устранена для формирования высококачественной базы знаний.
Обработка знаний заключается в дальнейшем извлечении неявных знаний на основе существующей базы знаний, построении новой онтологии и дополнении отношений, тем самым обогащая и расширяя базу знаний.
Оценка знаний может дать количественную оценку достоверности знаний, сохранить те из них, которые обладают более высокой степенью уверенности, и отбросить те, которые обладают меньшей уверенностью, чтобы эффективно обеспечить качество знаний.
Кроме того, построение крупномасштабных графов знаний требует поддержки различных технологий: распределенного хранения и вычислений, графовых баз данных, графовых рассуждений, баз данных в оперативной памяти и т. д.

Выбор базы данных для хранения данных

Хранение и язык запросов графов знаний также претерпел историческую промывку: от RDF до запросов OWL и SPARQL, от них постепенно отказались основные представители отрасли из-за неудобства и высокой стоимости. База данных графов постепенно стала основным методом хранения графов знаний в настоящее время.
В настоящее время широко используемые графовые базы данных включают Neo4j, graphsql, sparkgraphx (включая движок графовых вычислений), Titan на основе hbase, BlazeGraph и т. д. Языки хранения и языки запросов каждой компании также различаются. В практических сценариях приложений OrientDB и postgresql также имеют много приложений, в основном из-за их относительно низкой стоимости реализации и преимуществ в производительности.

Прикладное мышление и самообучение знаниям

В процессе построения графа знаний по-прежнему возникает много проблем с завершением отношений. Хотя общеизвестный граф может содержать миллионы сущностей и сотни миллионов относительных фактов, он далеко не полон. Завершение графа знаний состоит в том, чтобы предсказать отношения между сущностями через существующий граф знаний, что является важным дополнением к извлечению отношений.
Традиционные методы TransE и TransH строят вложения сущностей и отношений, рассматривая отношения как переводы от сущности A к сущности B, но эти модели просто предполагают, что сущности и отношения находятся в одном и том же семантическом пространстве. Фактически объект представляет собой комплекс, состоящий из нескольких атрибутов, и разные отношения сосредоточены на разных атрибутах объекта, поэтому недостаточно моделировать их в одном пространстве.

Релевантная информация

Построение, обоснование и применение крупномасштабного графа знаний
Сяо Янхуа | Построение и применение крупномасштабного графа знаний