Исследование нескольких основных интеллектуальных семантических платформ

NLP
Исследование нескольких основных интеллектуальных семантических платформ

несколько платформ

На этот раз мы в основном исследуем следующие пять интеллектуальных семантических платформ:

  1. Алиюн Сяоми (beebot) www.aliyun.com/product/beebot
  2. Baidu Duer (DuerOS) dueros.baidu.com
  3. Китайская семантическая платформа Tencent Wenzhi (xiaowei) xiaowei.qcloud.com
  4. Платформа Microsoft Intelligent Natural Language Understanding Platform (luis) www.luis.ai

Обзор платформы

image


Сцена, которую содержит робот

beebot

YunXiaomi — это диалоговый робот, ориентированный на разработчиков, который поддерживает интеллектуальные разговоры на основе обработки естественного языка (NLP) на различных терминалах сообщений. Содержит следующие общие области:

  1. Корпоративные закупки
  2. Система офисного программного обеспечения
  3. руководство по обращению
  4. Политика возмещения
  5. Развитие карьеры
  6. Знание счетов
  7. базовое администрирование
  8. Объекты компании

DuerOS

DuerOS от Baidu — это не просто робот, а скорее операционная система, обеспечивающая различные интерфейсы разработки программного и аппаратного обеспечения. Есть три основные категории:

  1. Пользовательские навыки предоставляют платформу для определения навыков, настройки намерений и словарей, определения намерений пользовательского ввода, а затем вызывают службы, соответствующие намерениям, для реализации разговорных навыков. Например, если вводится язык «помогите мне найти ближайшую еду», соответствующее намерение — «найти еду», а соответствующий интерфейс службы — «www.xxx.xxx/search», и результат будет возвращен в Пользователь.
  2. Навыки умного дома, этот навык в основном относится к навыкам производителей умных устройств, которые можно легко подключить к умным домам. Переводите сказанное пользователем или ввод текста в соответствующее действие.
  3. Навыки трансляции контента в основном настраиваются для производителей контента, например, загрузка текста информации, которую необходимо транслировать, а затем пользователи могут заказывать текстовые новости или голосовые новости.

xiaowei

Применимые сценарии для малых и микроклиентских роботов: пользователи импортируют информацию из базы знаний предметной области, чтобы создать информационную базу знаний о роботах.

  1. В домашнем сценарии устройство с экраном в доме подключается для реализации диалогового взаимодействия.
  2. В автомобильной сцене голос комбинируется с автомобилем для достижения языкового взаимодействия, такого как управление навигацией и воспроизведением музыки.
  3. В спортивных сценах голос пробуждает гарнитуру и приложение для взаимодействия.

luis

  1. Поле такси, намерения, такие как заказ такси.
  2. Домен места, который включает в себя различные намерения, связанные с местом.
  3. Поле погоды, включая отчеты о погоде и намерение прогноза.
  4. Домен напоминаний, включая создание, изменение и запрос функций напоминаний.
  5. Область повестки дня, включая планирование намерений руководства, связанных с темой повестки дня.
  6. В области умного дома он обеспечивает операционные намерения, такие как управление освещением и бытовой техникой.
  7. Поле примечания, предоставляющее намерения операции, такие как создание примечания, запрос и изменение.
  8. В области навигации по веб-странице он обеспечивает функциональное назначение, связанное с навигацией по веб-странице.
  9. Домен перевода предоставляет намерения, связанные с языком перевода.
  10. Поле управления устройством, включая намерение управлять устройством.
  11. Коммуникационный домен, предоставляющий намерения, связанные с телефонными звонками, электронными письмами и т. д.
  12. Музыкальный домен, предоставляющий намерения, связанные с воспроизведением музыки.
  13. Поле ресторана, указывающее намерение бронирования ресторана.

как пользоваться

beebot

  1. Зарегистрируйте учетную запись Alibaba Cloud и войдите в систему.
  2. Создайте робота и настройте основную информацию о роботе.
  3. Для выбора требуются встроенные знания предметной области, включая корпоративные закупки, системы офисного программного обеспечения, инструкции по работе с клиентами, политику возмещения расходов, базовое администрирование, развитие карьеры, знания о выставлении счетов и многое другое.
  4. Управляйте базой знаний и добавляйте новые записи.
  5. Добавьте связанный вопрос к записи, и связанный вопрос будет отображаться, когда вопрос, введенный пользователем, соответствует записи.
  6. Настройте намерение и введите различные вопросы, которые могут возникнуть у пользователя в связи с этим намерением.
  7. Маркировка сущностей, пометка соответствующих сущностей в предложении запроса пользователя.
  8. Настройте, будет ли ответ пользователя текстовым ответом, или настройте его в нашем собственном сервисном интерфейсе, а затем верните его пользователю.
  9. Онлайн выпуск.

这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

DuerOS

  1. Зарегистрируйте учетную запись Baidu и войдите в систему.
  2. Перейдите в фоновый режим, чтобы создать собственное намерение, которое включает в себя имя намерения, общие операторы выражений (и какие операторы соответствуют намерениям), слоты операторов выражений и ответы навыков (включая настраиваемые ответы и конфигурации служб, которые удовлетворяют двум категориям, настраиваемым). заключается в том, чтобы заполнить текстовый ответ самостоятельно, и если конфигурация сервиса устроит, дуэр перешлет данные после распознавания намерений на наш серверный интерфейс, а мы обработаем их самостоятельно). Кроме того, можно определить несколько раундов диалога, но каждый раунд диалога должен быть разработан нами.
  3. Создайте свой собственный словарь, доступно множество встроенных словарей, включая страны, китайские города, китайские провинции, районы/уезды/уезды, деревни/города, цвета, животные, иностранные города, достопримечательности, фестивали, фильмы, музыку, знаменитостей, растения, сериалы, варьете, автобус, метро, ​​идиомы, фамилии, бренды и т.д.
  4. В начале обучения DuerOS поможет нам сгенерировать множество различных выражений, например, мы определяем «познакомить с телекоммуникационным пакетом», он сгенерирует десятки подобных вопросов, «пояснить телекоммуникационный пакет», «познакомить с телекоммуникационным пакетом» И так on, но работу по маркировке все равно придется проделать самим, то есть пометить эти десятки сгенерированных предложений с похожими проблемами.
  5. Настройте информацию об интерфейсе службы.
  6. Тестируйте, выпускайте.

这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

xiaowei

  1. Зарегистрируйтесь в Tencent Cloud и войдите в систему.
  2. Подать заявку на малых и микро роботов.
  3. Создайте бота.
  4. Загрузить базу знаний.
  5. Настройте интерфейс службы.
  6. Создайте намерение и одновременно настройте слот.
  7. тренироваться.
  8. онлайн.

luis

  1. Войдите в свою учетную запись Майкрософт.
  2. Создайте приложение, в котором будет выбор культуры, оно содержит множество стран на выбор и понимает язык и слова в соответствии с различными национальными культурами.
  3. Вы можете выбрать нужное вам поле, поле содержит много намерений, и каждое намерение содержит много вопросов.
  4. Создавайте намерения и определяйте их в соответствии с потребностями вашего бизнеса.
  5. Создавайте сущности, которые можно использовать для сериализации вопросов.
  6. Добавление бизнес-вопросов один за другим — обычное дело для бизнес-консультантов.
  7. Отметьте соответствующие сущности в каждом заявлении о консультации по бизнес-вопросу и используйте его для извлечения сущности после последующего обучения.
  8. Начните обучение модели.
  9. После обучения начните использовать модель для прогнозирования намерений и извлечения сущностей.
  10. Опубликуйте модель и получите доступ к ней, используя предоставленный интерфейс URL.

这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

Интеграция

beebot

  1. API-интерфейс протокола HTTP.
https://chatbot.cn-shanghai.aliyuncs.com/
?Format=xml
&Version=2017-10-11
&Signature=Pc5WB8gokVn0xfeu%2FZV%2BiNM1dgI%3D 
&SignatureMethod=HMAC-SHA1
&SignatureNonce=15215528852396
&SignatureVersion=1.0
&AccessKeyId=key-test
&Timestamp=2017-10-11T12:00:00Z
<?xml version="1.0" encoding="UTF-8"?> 
<!—结果的根结点-->
<接口名称+Response>
    <!—返回请求标签-->
    <RequestId>4C467B38-3910-447D-87BC-AC049166F216</RequestId>
    <!—返回结果数据-->
</接口名称+Response>

DuerOS

  1. Интерфейс протокола HTTP.
  2. Серверный режим SDK, поддерживает PHP.
  3. Android SDK.
{
  "event": {
    "header": {
      "namespace": "ai.dueros.device_interface.text_input",
      "name": "TextInput",
      "messageId": "f894055e-a81e-4b4d-a97e-72c4d3a9ada4",
      "dialogRequestId": "720cc607-cff9-411e-83f4-03daca331ef3"
    },
    "payload": {
      "query": "介绍下电信套餐"
    }
  },
  "clientContext": [
    {
      "header": {
        "namespace": "ai.dueros.device_interface.location",
        "name": "GpsState"
      },
      "payload": {
        "longitude": null,
        "latitude": null,
        "geoCoordinateSystem": "BD09LL"
      }
    }
  ],
  "debug": {
    "bot": {
      "id": "ec773bfc-f907-bfae-160b-b6ec2250fd5d"
    },
    "simulator": true
  }
}

{
  "directive": {
    "header": {
      "namespace": "ai.dueros.device_interface.screen",
      "name": "RenderCard",
      "dialogRequestId": "720cc607-cff9-411e-83f4-03daca331ef3",
      "messageId": "NWE3MTNmMmU1ZWJiZTE0NTE="
    },
    "payload": {
      "type": "TextCard",
      "content": "请问套餐编号是什么?",
      "token": "eyJib3RfaWQiOiJ1cyIsInJlc3VsdF90b2tlbiI6IjBhYTU3MGM0LWNhODQtNGEzYS05NmM2LTBkOTAwM2Y3YjcyNSIsImJvdF90b2tlbiI6Im51bGwifQ=="
    }
  }
}

xiaowei

  1. Rest API
https://yun.tim.qq.com/v3/prophet/$command?appid=$appid&sdkappid=$sdkappid&identifier=$identifier&usersig=$usersig&random=999999&contenttype=json
{
    "botid": "third party account", 
    "auth": "", 
    "from_user_name": "小明", 
    "question": "发送消息失败", 
    "max_answer_num": 10
}

luis

Предоставляется только интерфейс URL, и все приложения обращаются к нему через протокол http. Например, при следующем доступе система вернет строку сообщений в формате json, включая оценки вероятности различных намерений и извлеченных сущностей.

запад US.API.cognitive.Microsoft.com/Luis/V2.0/ah…

{
  "query": "有没有流量包月套餐",
  "topScoringIntent": {
    "intent": "电信业务咨询",
    "score": 0.9712404
  },
  "intents": [
    {
      "intent": "电信业务咨询",
      "score": 0.9712404
    },
    {
      "intent": "None",
      "score": 0.2136391
    },
    {
      "intent": "查找餐馆",
      "score": 0.0577361658
    }
  ],
  "entities": [
    {
      "entity": "包月套餐",
      "type": "套餐",
      "startIndex": 5,
      "endIndex": 8,
      "score": 0.832137644
    }
  ]
}

Суммировать

  • Что касается объема данных, вам нужно добавить и определить большое количество бизнес-задач самостоятельно.
  • Что касается обучения, Луису необходимо самостоятельно обучить добавленные бизнес-задачи перед использованием модели, и обучение должно выполняться в браузере, что экономит ресурсы сервера.
  • Что касается эффекта, будут следующие эффекты: эффект «есть ли ежемесячный пакет для потока данных» и «месячный пакет для потока питания» одинаков.
  • Что касается платформенного подхода, аналогичный фон предоставляется пользователям для добавления себе бизнес-задач, чтобы отделить себя.
  • Что касается нескольких раундов диалога, обе платформы предоставляют только формат вопросов и ответов и не поддерживают несколько раундов диалога.
  • Что касается разнообразия диалогов, обе платформы должны сами добавлять несколько ответов на вопрос, чтобы добиться разнообразия, но этот метод также является относительно жестким.
  • Что касается семантической платформы bat, то это в основном платформы, которые предоставляют службу распознавания намерений и стыковки, позволяя разработчикам самостоятельно настраивать различные намерения и выражения, а также помогать пользователям понимать выражения и перенаправлять их в прямой интерфейс службы. Он также включает в себя большой объем работы по добавлению бизнес-данных и аннотаций, но он интегрирует некоторые общие модули и генерирует больше похожих вопросов-предложений в соответствии с выражениями, введенными разработчиками, которые могут включать больше типов вопросов, но сгенерированные предложения по-прежнему Мы должны маркировать его сами.

Сосредоточьтесь на искусственном интеллекте, чтении и мышлении, расскажите о математике, информатике, распределенных технологиях, машинном обучении, глубоком обучении, обработке естественного языка, алгоритмах и структурах данных, глубине Java, ядре Tomcat и т. д.