Как делать карту знаний, конечно, в двух словах не понятно. Прежде всего, вы должны сначала думать, исходя из собственного бизнеса.Вот несколько основных путей построения графов знаний.
логичная идея построения
-
1. Разберитесь с бизнесом и постройте онтологию: нужно ли вам использовать граф знаний? Какова стоимость и каков эффект? Способен ли он построить граф знаний? Могут ли данные, команда и т. д. поддержать это? Если необходимо, как отсортировать набор онтологических фреймворков в соответствии с бизнесом?
-
2. Отредактируйте онтологию и задайте структуру представления бизнес-знаний: Protege можно использовать для редактирования онтологии, чтобы получить файл представления знаний, представленный OWL.
-
3. Дополните онтологию примерами данных: сначала найдите несколько примеров данных, чтобы облегчить понимание.
Различные способы построения
-
Метод построения сверху вниз: сначала определите онтологию и схему данных, а затем добавьте сущность в базу знаний. Используйте некоторую существующую структурированную базу знаний в качестве базовой базы знаний.
-
Метод построения снизу вверх: извлечение объектов из некоторых данных открытых ссылок, выбор объектов с более высокой степенью достоверности и добавление их в базу знаний, а затем построение онтологической модели верхнего уровня.
Ключевые технологии в строительном процессе
-
Обычно он включает пять аспектов: извлечение знаний, представление знаний, объединение знаний, обработку знаний и оценку знаний.
-
С помощью технологии извлечения знаний элементы знаний, такие как сущности, отношения и атрибуты, могут быть извлечены из данных некоторых открытых полуструктурированных, неструктурированных и структурированных сторонних баз данных.
-
Представление знаний представляет элементы знаний через определенные эффективные средства, удобные для дальнейшей обработки и использования. Комплексный вектор, сформированный распределенным представлением знаний, имеет большое значение для построения, рассуждения, объединения и применения базы знаний.
-
Затем посредством слияния знаний неоднозначность между сущностями, отношениями, атрибутами и другими референтами и объектами фактов может быть устранена для формирования высококачественной базы знаний.
-
Обработка знаний заключается в дальнейшем извлечении неявных знаний на основе существующей базы знаний, построении новой онтологии и дополнении отношений, тем самым обогащая и расширяя базу знаний.
-
Оценка знаний может дать количественную оценку достоверности знаний, сохранить те из них, которые обладают более высокой степенью уверенности, и отбросить те, которые обладают меньшей уверенностью, чтобы эффективно обеспечить качество знаний.
-
Кроме того, построение крупномасштабных графов знаний требует поддержки различных технологий: распределенного хранения и вычислений, графовых баз данных, графовых рассуждений, баз данных в оперативной памяти и т. д.
Выбор базы данных для хранения данных
-
Хранение и язык запросов графов знаний также претерпел историческую промывку: от RDF до запросов OWL и SPARQL, от них постепенно отказались основные представители отрасли из-за неудобства и высокой стоимости. База данных графов постепенно стала основным методом хранения графов знаний в настоящее время.
-
В настоящее время широко используемые графовые базы данных включают Neo4j, graphsql, sparkgraphx (включая движок графовых вычислений), Titan на основе hbase, BlazeGraph и т. д. Языки хранения и языки запросов каждой компании также различаются. В практических сценариях приложений OrientDB и postgresql также имеют много приложений, в основном из-за их относительно низкой стоимости реализации и преимуществ в производительности.
Прикладное мышление и самообучение знаниям
-
В процессе построения графа знаний по-прежнему возникает много проблем с завершением отношений. Хотя общеизвестный граф может содержать миллионы сущностей и сотни миллионов относительных фактов, он далеко не полон. Завершение графа знаний состоит в том, чтобы предсказать отношения между сущностями через существующий граф знаний, что является важным дополнением к извлечению отношений.
-
Традиционные методы TransE и TransH строят вложения сущностей и отношений, рассматривая отношения как переводы от сущности A к сущности B, но эти модели просто предполагают, что сущности и отношения находятся в одном и том же семантическом пространстве. Фактически объект представляет собой комплекс, состоящий из нескольких атрибутов, и разные отношения сосредоточены на разных атрибутах объекта, поэтому недостаточно моделировать их в одном пространстве.