Промежуточная станция AI — архитектура и применение интеллектуальной платформы чат-ботов (общая запись)

Архитектура робот

Источник контента: 3-й Технический салон Технологического института Исинь — Онлайн-трансляция | Промежуточная станция AI — Интеллектуальная платформа для чат-ботов

Докладчик: Ван Донг, руководитель группы мидл-офиса ИИ Технологического центра CreditEase.

Введение: С предложением стратегии «Чжунтай» строительство Чжунтай CreditEase добилось многих достижений в идеологических концепциях и архитектурном дизайне. Как CreditEase создал «AI Zhongtai» и связанные с ним интеллектуальные продукты с помощью идеи Zhongtaiization? В этой прямой трансляции г-н Ван Дун, глава группы ИИ среднего уровня в Технологическом центре CreditEase, поделился конкретным путем внедрения ИИ среднего уровня CreditEase и сосредоточился на интеллектуальном продукте ИИ среднего уровня - интеллектуальном. Платформа чат-ботов, в том числе интеллектуальные чат-боты Базовые концепции, идеи дизайна, техническая архитектура и сценарии приложений платформы, возможности, которые может предоставить платформа, и то, как она может быстро поддерживать деловые стороны, дают практическую идею для создания интеллектуальных продуктов с идеей Китайско-тайваньская.

——————

Первые два технических салона поделились практикой создания промежуточной платформы ИИ CreditEase и промежуточной платформы данных соответственно.В этом обмене сначала будет рассмотрен общий дизайн и путь реализации промежуточной платформы ИИ, а также взаимосвязь между промежуточной платформой ИИ и промежуточной платформой данных, а затем перейти к деталям В этом документе представлена ​​интеллектуальная платформа чат-ботов, основанная на идее Zhongtai, включая ее техническую архитектуру, технические принципы, основные функциональные точки, сценарии приложений и эффекты приложений.

1. Общий дизайн и этапы реализации промежуточной платформы ИИ

1.1 Эволюция бизнеса и общие требования к разведке

С непрерывным развитием бизнеса бизнес находится на разных стадиях развития, и спрос на данные также изменился: сначала они были доступны для анализа BI, а затем стали простыми в использовании (гибкий анализ). использовать - анализ данных. Например, клиентская система предлагает сегментацию клиентов, персонализированные рекомендации, интеллектуальные вопросы и ответы, прогнозирование модели и т. д., а для внутреннего исследования данных требуется анализ ассоциации, кластерный анализ, непрерывный анализ и т. д., все из которых выдвигаются вперед. потребность в интеллектуальном анализе данных.

  • Платформизация данных может решить проблему доступности данных и обеспечить такие функции, как управление платформой данных, хранение данных, расчет данных, управление, эксплуатация и обслуживание;
  • Централизация данных может решить проблему простоты использования, обеспечить самообслуживание и гибкую поддержку, а также поддержку активизации, интеграции и работы с данными.
  • Аналитика данных решает простые в использовании задачи: от анализа данных до прогнозирования обучения, инноваций на основе данных.

1.2 От центра обработки данных до центра искусственного интеллекта

В дополнение к возможностям платформы центр обработки данных также предоставляет некоторые более продвинутые возможности, такие как преобразование данных в базовую услугу и предоставление их бизнес-стороне.Бизнес-сторона может получать данные и выполнять обработку данных в центре обработки данных самостоятельно. -способ обслуживания., исследование данных, интеллектуальный анализ данных, бурение анализа, многомерный анализ, отчеты самообслуживания, совместное использование данных и т. д., чтобы быстро реализовать их ценность для бизнеса.

С развитием бизнеса выдвигаются все более и более интеллектуальные требования к данным.Эти интеллектуальные требования включают в себя обучение модели, маркировку данных, разработку функций, развертывание модели, мониторинг производительности и т. д., которые должны поддерживаться такими алгоритмами, как машинное обучение и глубокое обучение. . Основная цель центра обработки данных — обслуживать данные, которые не могут хорошо поддерживать интеллект и модели, поэтому на свет появился центр ИИ.

Мы абстрагируемся от требований интеллектуальных сервисов и формируем независимый промежуточный уровень ИИ. Средний уровень искусственного интеллекта — это инфраструктурная платформа для создания интеллектуальных сервисов.Он предоставляет возможности распределенного и многоуровневого построения и услуги управления полным жизненным циклом для моделей, требуемых компанией.Он побуждает различные сферы бизнеса интегрировать базовые, основанные на сценариях, и универсальный. Возможности искусственного интеллекта заложены в платформу для усиления повторного использования моделей, инноваций в портфолио и масштабирования и, в конечном итоге, для достижения цели снижения затрат и повышения эффективности и быстрого реагирования на деловые стороны.

1.3 Отношения между центром обработки данных и центром ИИ

Поскольку центр обработки данных и центр ИИ упоминаются, многие люди спросят: какая связь между центром обработки данных и центром ИИ?

Центр обработки данных и центр искусственного интеллекта взаимозависимы и связывают прошлое с будущим.

Во-первых, и центр обработки данных, и центр ИИ предоставляют услуги внешнему миру, но фокус разный.

  • Центр обработки данных предоставляет различные услуги данных и продукты данных, такие как: приложение для отчетов BI, исследование данных и т. д.
  • Платформа ИИ среднего уровня предоставляет различные интеллектуальные услуги и интеллектуальные продукты, а также выполняет комплексное обучение и прогнозирование интеллектуальных исследований и разработок спроса, обучение моделей, проектирование функций, аннотирование данных и другие возможности. Например: предсказание модели, интеллектуальная рекомендация и т. д.

Во-вторых, центр обработки данных и центр ИИ взаимозависимы и поддерживают друг друга.

  • Опираясь на возможности обработки данных и наборы инструментов, предоставляемые центром обработки данных, центр искусственного интеллекта ускоряет разработку и повторное использование сервисов, связанных с искусственным интеллектом, для удовлетворения бизнес-потребностей во внешнем интеллекте. Очищенные данные в центре обработки данных позволяют создавать интеллектуальные проекты с меньшими затратами.
  • Центр обработки данных также должен использовать интеллектуальные возможности центра искусственного интеллекта, чтобы сделать использование данных более гражданским и интеллектуальным. Например, расширенный анализ бизнес-аналитики: взаимодействие на естественном языке, снижение порога для использования бизнес-аналитики; анализ ИИ предлагает варианты участия, помогая обычным пользователям эффективно получать доступ к данным без специалистов по данным; улучшенное управление данными: использование машинного обучения для управления данными, включая качество данных. , управление метаданными, управление мастер-данными и т. д.

1.4 Болевые точки, которые необходимо решить в мидл-энде ИИ

В прошлом многие команды алгоритмов были больше похожи на команды аутсорсинга алгоритмов, которые занимали свои позиции в соответствии с потребностями различных направлений бизнеса и добивались целей одну за другой. Хотя эта форма добилась многих достижений, существуют проблемы повторного построения и ограниченной эффективности.

Мы резюмируем эти вопросы следующим образом:

  • Разработка «в стиле дымохода», стоимость проекта высока, его нелегко интегрировать, процесс повторяется, и отсутствует возможность осаждения.
  • Доступ к моделям осуществляется по-разному, взаимосвязь вызовов сложна, и отсутствует оптимизация и координация оркестровки.
  • Ручная обработка данных, отсутствие унифицированных каналов доступа к данным, трудности со сбором данных и несогласованные стандарты.
  • При разработке модели отсутствуют стандартные рекомендации, множество ролей участников, отсутствие совместной работы и автоматизированной помощи, а также трудно эффективно управлять коммуникацией и сотрудничеством.
  • Предоставление модели затруднено, и отсутствует унифицированная работа с моделью, платформа мониторинга, интерфейс управления услугами, а также механизм обновления и обслуживания.
  • Основные ресурсы разбросаны и изолированы, а ресурсы не могут распределяться и управляться динамически, что приводит к потерям.

Это болевые точки, которые должна решить платформа среднего уровня ИИ.Что касается вышеуказанных болевых точек, мы надеемся:

  • Стандартизированная платформа алгоритмов и моделей, а также стандартизированное руководство по процессу НИОКР для повышения возможности повторного использования.
  • Унифицированная спецификация интерфейса службы поддерживает динамическое расположение и состав служб.
  • Подключитесь к центру обработки данных и используйте возможности центра обработки данных для стандартизации и предварительной обработки данных.
  • Оптимизация процессов, четкое определение ролей, построение конвейеров продуктов ИИ и наличие функций автоматической итерации и циркуляции внутри и между ссылками.
  • Предоставьте унифицированное развертывание доставки модели, рабочую среду и возможности мониторинга, а также механизм обновления модели.
  • Унифицированное управление ресурсами, включая вычислительные ресурсы, ресурсы хранения и т. д., поддерживает гибкое планирование ресурсов.

Подводя итог: повторное использование, унификация услуг, стыковка с центром обработки данных, оптимизация ролей процессов, мониторинг операций, управление ресурсами и контроль, и, наконец, превращение центра ИИ в мощный центр поддержки возможностей ИИ, который может быстро обеспечить огневую мощь в соответствии с потребностями бизнеса. достичь коммерческой ценности.

1.5 Архитектура промежуточной платформы ИИ

Платформенная архитектура промежуточного этапа ИИ представлена ​​ниже.

Внизу находится центр обработки данных, который обеспечивает обработку данных, анализ данных, управление данными, безопасность данных, службы данных и другие возможности. Наверху находится бизнес-стойка регистрации, включая различные бизнес-направления. Средний уровень ИИ находится между средним уровнем данных и внешним интерфейсом бизнеса.

Как показано на рисунке, вся платформа ИИ состоит из нескольких модулей:

  • Интеллектуальный сервис AIHub: инкапсулирует модели в виде сервисов и предоставляет сервисы моделей, работающие с возможностями платформы. Включая тестирование выпуска модели, автоматическое развертывание, обновление модели, доставку модели, упаковку продукта и т. д.
  • Мониторинг платформы AIMon: отслеживайте и предупреждайте работающую модель, а также предоставляйте услуги мониторинга платформы. Включая тестирование производительности, обратную связь о состоянии, ранние предупреждения и т. д.
  • AIKit Intelligent Toolbox: предоставляет легкие, малонавязчивые сервисы инструментов ИИ, которые могут свободно выбирать команды приложений ИИ. Например, легко встраивая среду разработки на языке Python, Moonbox может предоставлять виртуальные данные запросов, смешанные данные и другие возможности. Он также предоставляет возможности аннотирования данных, включая структурированные данные и интерактивные аннотации неструктурированных данных, таких как текст и изображения.
  • Управление промежуточным офисом AIMgt: некоторые общие возможности управления промежуточной станцией ИИ. В том числе: разрешения ролей, управление арендаторами, управление процессами, управление ресурсами и т. д.
  • Интеллектуальная лаборатория AILab: обеспечивает обучение стандартным моделям и поддержку процесса оптимизации. Включая проектирование модели, обучение модели, проектирование функций, обработку функций, отслеживание модели, оценку модели, библиотеку алгоритмов, библиотеку моделей и т. д.
  • Интеллектуальные активы AIAsset: используются для управления модельными активами, для достижения возможностей искусственного интеллекта, повторного использования и инвентаризации.
  • Разговорный пользовательский интерфейс CUI: это продукт нашего мидл-офиса ИИ. Это платформа чат-бота, которую мы представим далее, которую можно использовать для вопросов и ответов, чата, задач, рекомендаций и других сценариев. С точки зрения платформы робота, это также включает голосовых исходящих роботов.

1.6 Архитектура возможностей средней платформы ИИ

На рисунке выше показана архитектура возможностей ИИ среднего уровня. Мы описываем внешний результат промежуточного этапа ИИ с точки зрения возможностей. В дополнение к описанным выше возможностям эксплуатации сервиса, возможностям мониторинга и раннего предупреждения, а также возможностям управления ресурсами (то есть модулям слева на рисунке), мы делим возможности мидл-энда ИИ на четыре слоя:

1) Слой платформы

Например, возможность сбора данных, возможность онлайн-обучения, возможность онлайн-маркировки, возможность разработки функций, возможность обучения самообслуживанию и т. Д. Эти возможности достигаются с помощью набора инструментов AI и AIlab.

К пользователям этого слоя в основном относятся:

  • Инженеры-алгоритмы (средняя платформа ИИ, команда ИИ), они могут использовать возможности уровня платформы, предоставляемые средней платформой ИИ, для проведения онлайн-обучения, повторного использования библиотек алгоритмов, повторного использования вычислительных ресурсов платформы и проведения различных экспериментов.
  • Старшие специалисты по исследованиям и разработкам и аналитики данных могут использовать возможности самообучения ИИ среднего уровня для проведения самообучения, например, они могут самостоятельно обучать модели классификации на основе своих помеченных данных.

2) Уровень технологии ИИ

Слой технологии ИИ в основном обеспечивает: основные возможности ИИ, включая лексический анализ, синтез речи, классификацию статей, распознавание изображений и т. д. По сути, это возможности технологии ИИ НЛП, голоса, изображения, видео и других основных категорий.

3) бизнес-уровень ИИ

Бизнес-уровень ИИ в основном предоставляет возможности, которые может обеспечить сочетание технологии ИИ и бизнеса, например: извлечение комментариев, маркировка статей, идентификация карт, распознавание лиц, просмотр видео и т. д.

Разница между уровнем технологии ИИ и бизнес-уровнем заключается в том, что уровень технологии ИИ в основном предоставляет базовые возможности ИИ, такие как NLP, CV, голос и видео. Бизнес-уровень ИИ в основном сочетает в себе технологию ИИ с конкретными бизнес-сценариями, такими как распознавание удостоверений личности, признание академической квалификации, распознавание проверочного кода и т. д.

Пользователями этих двух уровней являются: разработчики приложений бизнес-группы, которые могут напрямую вызывать интеллектуальные службы для реализации интеллектуальных бизнес-сценариев, таких как: сходство коротких текстов, языковой синтез, распознавание билетов и т. д.

4) Слой продукта

Этот уровень предоставляет внешние услуги в виде продуктов, таких как интеллектуальные роботы, графы знаний и т. д.

Пользователями этого уровня являются: деловые люди компании или непосредственные клиенты компании, которые могут получать результаты, непосредственно используя продукт, например робота.

Вышеуказанные три слоя — это активы ИИ. С точки зрения влияния, уровень продукта имеет наибольшее влияние, за ним следуют бизнес-уровень, технический уровень и, наконец, уровень платформы. На пути реализации промежуточного этапа ИИ мы также будем строить и внедрять в соответствии с этим приоритетом.

1.7 Идея построения промежуточной станции ИИ - открытость

Девиз дата-центра — цивилизованность и маневренность. Лозунг AI Zhongtai — открытость.

Идея создания AI Middle Station состоит в том, чтобы надеяться, что несколько сторон объединят свои усилия, будут открытыми и прозрачными, будут участвовать в широком диапазоне и достигнут консенсуса посредством консенсуса, чтобы способствовать ускорению возможностей AI, укреплять повторное использование услуг AI, и снизить затраты и повысить эффективность.

Мы уделяем больше внимания общим требованиям ИИ и предоставляем обобщенные интеллектуальные услуги для групп приложений ИИ в различных областях. Подчеркните платформу и возможность повторного использования, а также поощряйте обобщение и платформизацию базовых и основанных на сценах сервисов искусственного интеллекта.

Широкая поддержка большого количества интеллектуальных бизнес-потребностей, с которыми сталкиваются группы приложений ИИ в сферах крупного, среднего и малого бизнеса, и предоставление платформ для обучения моделей, мониторинга операций моделей и услуг хостинга, а также общих инструментов ИИ для облегчения быстрого запуска интеллектуальных приложений для фронта. -конечные предприятия. В процессе внедрения существующие технические ресурсы, включая центр обработки данных, будут полностью использованы, а маршрут внедрения будет определяться в зависимости от силы и важности потребностей бизнеса.

Мы надеемся, что ИИ больше не вишенка на торте, а необходимая возможность, позволяющая разработчикам вернуться на путь понимания бизнеса и творчества и сосредоточиться на собственной бизнес-логике. Все возможности ИИ будут открыты для разработчиков и пользователей, включая голос, видео, обработку естественного языка, карты знаний и т. д. Мы инкапсулируем эти возможности, и разработчики смогут вызывать их напрямую.

2. Предыстория, концепция дизайна и техническая архитектура платформы робота.

2.1 Интеллектуальный чат-бот

Основываясь на идее Чжунтая, как нам построить платформу для роботов?

Интеллектуальный чат-бот — это программа, которая имитирует человеческие разговоры с помощью естественного языка.

В настоящее время чат-боты в определенных сценариях и областях продемонстрировали высокие возможности понимания и обработки естественного языка, такие как Xiaodu, Siri, Xiaoai и т. д.

Интеллектуальные чат-боты могут заменить относительно жесткие и повторяющиеся трудоемкие задачи или процессы на предприятии, в том числе:

  • Консультация по вопросам: отвечайте на бизнес-вопросы на основе базы бизнес-знаний.
  • Поиск данных: извлекайте данные или документы из различных бизнес-систем или баз данных.
  • Бизнес-обработка: подключение к соответствующим бизнес-системам для передачи инструкций и выполнения соответствующих бизнес-операций.

Типичные сценарии применения: в дополнение к чату, интеллектуальные чат-роботы также могут использоваться в вопросах и ответах в качестве робота вопросов и ответов для ответов на вопросы в профессиональной сфере; в качестве робота-задачи для выполнения онлайн и даже некоторых офлайн-задач; в качестве рекомендации. робот, рекомендует статьи, музыку, продукт; как робот-помощник, он интегрирует вышеуказанные функции.

Интеллектуальные чат-боты могут обеспечивать внешнее обслуживание клиентов и внутреннюю бизнес-помощь для всестороннего повышения эффективности, снижения затрат и повышения эффективности.

2.2 Суть интеллектуальных чат-ботов: диалоговый пользовательский интерфейс

Суть интеллектуального чат-бота — диалоговый пользовательский интерфейс. Разговорный пользовательский интерфейс предназначен для отображения существующих данных, функций и услуг пользователям посредством разговоров.

Диалоговый пользовательский интерфейс имеет уникальные преимущества по сравнению с традиционным пользовательским интерфейсом.

  • Улучшите внимание пользователей. В сегодняшней информационной фрагментарности у пользователей не так много времени для постоянной концентрации, и люди легко отвлекаются на разные вещи. В диалоговом пользовательском интерфейсе информация предоставляется постепенно в соответствии с потребностями пользователя в инструкциях, чтобы пользователь не отвлекался на ненужную информацию.
  • Уменьшите разочарование пользователей. В диалоговом пользовательском интерфейсе операции, которые могут выполнять пользователи, относительно ограничены, что также позволяет избежать проблемы неконтролируемых высоких ошибок, вызванных поведением пользователя. Предоставление пользователям возможности задавать простые вопросы с несколькими вариантами ответов может снизить затраты на размышления пользователей и частоту системных ошибок и, в конечном итоге, позволить пользователям быстро сосредоточиться на том, что они хотят, и уменьшить разочарование, вызванное операциями.
  • Более высокое отношение ввода-вывода. Еще одним преимуществом диалогового пользовательского интерфейса является его экономичность. Диалоговый пользовательский интерфейс пользовательского интерфейса может быть запущен в работу сразу после выхода в сеть, без преднамеренного обучения и обучения, что снижает стоимость использования, а дизайн диалога может быть скорректирован и изменен в любое время в соответствии с бизнес-логикой и условиями применения.

Как сказал Голден Кришна, старший дизайнер Samsung Labs: «Лучший интерфейс — это отсутствие интерфейса». Многие люди считают, что голосовое взаимодействие менее навязчиво, чем чат-боты, и обеспечивает лучший пользовательский опыт.

Это также является причиной того, что все виды интеллектуальных динамиков пользуются большим спросом на рынке, а голосовое взаимодействие проникло в тысячи домашних хозяйств по всему миру.

2.3 Тенденция: диалоговый пользовательский интерфейс и бизнес-интеграция

В настоящее время тесная интеграция диалогового пользовательского интерфейса и бизнес-системы является основной тенденцией развития. Интегрируя различные бизнес-системы, можно создать эксклюзивного бизнес-помощника. Как показано на рисунке выше, мы можем интегрировать в бизнес-систему множество сервисов, таких как просмотр отчетов, интеграция инструкций, запрос графа знаний и запрос по электронной почте, а также предоставить функцию проверки разрешений для создания эксклюзивного бизнес-помощника.

Некоторые отраслевые прогнозы утверждают, что:

  • В будущем более зрелые технологии позволят чат-ботам более точно определять вопросы и намерения пользователей.
  • Обслуживание клиентов является основным полем битвы для чат-ботов и областью, где создается наибольшая выгода.
  • Чат-боты широко используются в электронной коммерции, коммуникациях, страховании, финансах, путешествиях и других сферах.
  • Взяв в качестве примера расширенный анализ больших данных с использованием НЛП на естественном языке и других интерактивных методов, порог для использования BI еще больше снижается.

Gartner прогнозирует, что к 2020 году: 50% аналитических запросов будут генерироваться с помощью поиска, обработки естественного языка или речи или автоматически. Уровень использования бизнес-работников на переднем крае для анализа и использования продуктов бизнес-аналитики посредством обработки естественного языка и анализа разговоров увеличился с 35% до более чем 50%.

2.4 Процесс создания интеллектуального чат-бота

Далее мы подробно расскажем о процессе создания чат-бота.

Создание интеллектуальных чат-ботов является сложной задачей. Например, разработка интеллектуального ядра роботов требует определенных возможностей исследования и разработки ИИ; роботам требуется полный набор пакетов моделей, а также поддержка инженерных возможностей, таких как управление данными, планирование задач, и контроль полномочий; все направления бизнеса имеют широкий спектр потребностей, и реализация каждого из них будет длительным процессом.

Если вы будете следовать методу построения одной линии и одной линии, как показано на рисунке, когда коллеги по ИИ и коллеги по платформе поддерживают первый бизнес, спрос со стороны других бизнес-направлений отсутствует.Согласно поддержке проекта, вы можете быстро реагировать на спрос, и опыт в настоящее время очень хороший. Хорошо, для второго бизнеса, поскольку коллеги по ИИ и коллеги по платформе поддерживают первый бизнес, функции второго бизнес-направления будут отсутствовать. Вы можете видеть робота в бизнес-линии B на рисунке отсутствует одна нога, а затем есть ожидание, к третьей бизнес-линии она вступила в стадию планирования спроса, и поддержка коллег по ИИ и коллег по платформе для этой бизнес-линии очень ограничена; Точно так же последующая бизнес-линия Все будет в состоянии ожидания.Хотя деловая сторона очень рассержена, коллеги по ИИ и коллеги по платформе уже истощены.

Из этого видно, что недостатки исследования и разработки этого робота дымоходного типа заключаются в длительности и высокой стоимости.

Итак, как мы можем эффективно удовлетворить эти потребности?

2.5 Фабрика роботов

Создайте интеллектуальную платформу для чат-ботов с китайско-тайваньским мышлением. Благодаря платформенной конструкции и идее повторного использования наш чат-бот стал фабрикой по производству чат-ботов.

  • Повторное использование модели ИИ: инженеры ИИ создают общие модели ИИ, и им требуется лишь небольшой объем конкретных бизнес-данных для создания персонализированного ядра робота.
  • Возможности проектирования на основе платформы. Конструкция на основе платформы предоставляет набор всеобъемлющих и обобщенных функций управления роботами, предоставляет различные возможности и реализует повторное использование инженерных модулей и возможностей.

В процессе создания интеллектуальной платформы чат-ботов мы интегрируем потребности и возможности каждого направления бизнеса в платформу и предоставляем их для использования разными направлениями бизнеса.Каждое направление бизнеса повторно использует эти возможности и обеспечивает высокую степень изоляции разрешений на данные.

Наконец, он обеспечивает производство потока роботов, повторно используемые функции управления, высокоскоростной доступ для бизнес-пользователей и быстро расширяет возможности всех областей.

2.6 Рекомендации по проектированию интеллектуальной платформы чат-ботов

Соображения по проектированию интеллектуальной платформы чат-ботов включают следующее.

1) Платформа или проектная система

Поскольку мы строим на основе платформы, мы неизбежно столкнемся с некоторыми проблемами: преимущество конструкции на основе платформы заключается в том, что ее можно повторно использовать и достигать большего с меньшими усилиями; недостаток в том, что ее трудно совместимо с персонализацией. . Поэтому в процессе построения платформы мы также должны учитывать, какие функции принадлежат платформе, какие функции принадлежат арендаторам, а какие функции принадлежат компании.Мы должны ускорить публичные функции и настроить функции арендаторов. Учитывая мультипликационный эффект платформы, он также может удовлетворить индивидуальные потребности.

2) Возможности мидл-офиса

  • Мульти аренды. Мы создаем интеллектуальную платформу чат-ботов с несколькими арендаторами, определяем функции на основе ролей пользователей и разделяем возможности между администраторами платформы и функциями арендаторов.
  • Самопомощь. Все функции находятся в самообслуживании, а управление, эксплуатация и техническое обслуживание делегированы арендаторам.Таким образом, арендаторы могут соответствующим образом управлять своими собственными роботами, и обслуживание платформы будет значительно сокращено, и нет необходимости ждать расписание.
  • Изоляция и безопасность. Распределение затрат рассчитывается посредством изоляции ресурсов (включая изоляцию данных и изоляцию языка) и изоляции вычислительной мощности, что также может гарантировать, что данные не влияют друг на друга. Кроме того, безопасность данных обеспечивается ортогональным образом на основе двойных ролей функциональных ролей и ролей данных.

4) Единый замкнутый цикл

  • Платформа интеллектуального робота представляет собой унифицированный результат проектирования, алгоритма и работы. Робот — это не простая модель алгоритма, для его выполнения требуется работа с моделью, управление данными, контроль полномочий, ручное вмешательство, поддержка клиентов и т. д., а также операционная поддержка и поощрение, такие как система баллов, представленная на нашей платформе. некоторые операции в зависимости от ситуации точки Действия, чтобы побудить всех использовать некоторые функции.
  • Замкнутый цикл платформы, данных и модели формируется путем непрерывного добавления вопросов, онлайн-аннотации, экспорта корпуса, автоматического обучения и автоматического онлайн-запуска во время работы. Например, мы разработали управление сеансами для онлайн-аннотаций, чтобы помочь пользователям быстро дополнять вопросы.

2.7 Системная архитектура платформы интеллектуальных роботов

На приведенном выше рисунке показана системная архитектура платформы интеллектуального робота.

  • Вершина — это сервис, предоставляемый роботом внешнему миру, и сервис предоставляется извне через Интернет, приложение и Restful API.
  • Посередине находится уровень микросервисов, использующий микросервисную архитектуру Spring Cloud, а сервисы зарегистрированы в Eureka. К микросервисам относятся шлюзовые сервисы, сервисы планирования, внешние сервисы, сервисы бизнес-логики, уровень доступа к данным, статистические сервисы, коммуникационные сервисы и т. д. Модуль, участвующий в прогнозировании алгоритма, находится в службе Python, и мы также регистрируем службу Python в Eureka, что также является идеей, которую мы называем «Модель как услуга».
  • Внешняя система аутентификации включает LDAP, SSO, PS и т. д., а внешняя система включает в себя различные терминалы ПК, терминалы приложений, отчеты и т. д.
  • Данные хранятся в Mongo, документы хранятся в HDFS, Elastic-Search используется для поиска, Click-house используется для статистики, Rabbit mq используется для ручной фоновой связи, а Redis используется для управления сеансом и контекстом.

Вся платформа представляет собой микросервисную архитектуру, поддерживает контейнеризацию, поддерживает оркестрацию с использованием модели Conductor и использует протокол MQTT для решения проблемы нестабильности сети на стороне приложения.

3. Основные принципы и основные функциональные моменты платформы робота

3.1 Основная технология роботов

В предыдущей статье были представлены основы, концепция дизайна и техническая архитектура платформы робота, а затем представлены основные принципы и основные функциональные моменты платформы робота.

Основной частью интеллектуального чат-бота является механизм диалога, который включает в себя: автоматическое распознавание речи (ASR), понимание естественного языка (NLU), управление диалогами (DM), генерацию естественного языка (NLG) и синтез речи (TTS). ).

Среди них цель понимания естественного языка (NLU) состоит в том, чтобы преобразовать текст в семантическое представление.Семантика слов в тексте не важна, но важно то, что текст преобразуется в семантическую информацию. Проще говоря, это преобразование человеческого языка в структурированную и полную семантику, которая может быть понята машинами, чтобы машины могли понимать человеческий язык.

То, что мы обычно называем обработкой естественного языка NLP, на самом деле является большим набором, включая понимание естественного языка NLU и генерацию естественного языка NLG, и включает в себя часть обработки выше и этап приложения ниже, поэтому и NLU, и NLG являются подмножеством NLP, они не являются в отношениях уровня.

DM является мозгом системы управления диалогами и отвечает за обновление состояния диалога. Сложность диалогового движка заключается в NLU и DM.

В целом, эти технологии относятся к Обработке естественного языка (NLP, Natural Language Processing), по сути нам нужно использовать технологию NLP для решения проблемы чат-ботов.

Для вопроса пользователя вопрос на естественном языке должен быть преобразован в форму данных, которую машина может понять с помощью модели (эта модель получается с помощью машинного обучения на основе большого количества данных обучения и индукции) (мы называем эти данные форма как вектор).

Помимо использования в интеллектуальных чат-роботах, технология NLP также используется во многих областях, таких как: синтаксический и семантический анализ, извлечение информации, анализ текста, машинный перевод, поиск информации, диалоговые системы и другие области.

3.2 Принцип работы робота

Интеллектуальные чат-боты состоят из нескольких роботов, включая роботов вопросов и ответов, чат-роботов, роботов-задач и т. д. Ручной фон и библиотека документов взаимодействуют для выполнения задач и, наконец, выбирают лучший ответ и возвращают его пользователю.

Как показано на рисунке, пользователь задает вопрос:

  • Во-первых, ASR преобразует речь в текст, что требует планирования. Платформенные сервисы и планировщик задач считают, что это проблема робота, и переходят к стадии предварительной обработки.
  • Предварительная обработка включает в себя сегментацию/остановку слов, сопоставление словарного запаса, анализ частей речи, синтаксический анализ, распознавание сущностей, повторение предложений, извлечение отношений и т. д.;
  • Затем перейдите к этапу анализа, включая анализ предметной области, классификацию проблем, обнаружение намерений и идентификацию ботов;
  • Затем перейдите к другим ботам, таким как боты QA — отвечающие на фактические и нефактические вопросы пользователя, чат-боты — отвечающие на эмоциональные выражения пользователя и обсуждение объективных вопросов, боты задач — операции задач, которые удовлетворяют определенным сценариям, боты сцены, робот Knowledge Graph. , и т.д.;
  • После этого результаты агрегируются в слой ранжирования слияния, и выполняется коррекция ответа взвешенной перестановкой;
  • Наконец, после фильтрации по полномочиям пользователя генерируется ответ, который возвращается пользователю через синтезированную речь TTS.

Если робот не может ответить на этот вопрос, он перейдет к ручному фону или перейдет к поисковой системе, чтобы ввести поиск и поиск документа, и, наконец, вернет лучший ответ.

3.3 Робот контроля качества

Суть робота QA заключается в следующем: если пользователь задает вопрос Q, робот QA должен найти наиболее подходящую пару QA из существующей базы данных QA для возврата, и робот QA выполнит расчет подобия QQ и расчет соответствия QA. При степени совпадения находим наиболее подходящий набор пар КА (Qi, Ai), то есть возвращается лучший ответ.

Решение 1: модель NN

Общие сетевые модели включают модели RNN и CNN. Например, модель долговременной кратковременной памяти (LSTM) двухслойного кодировщика (декодера). Эта модель хорошо работает во многих сценариях.Основным недостатком сетевой модели является то, что она требует определенного количества выборок.

Решение 2: Разделить на подзадачи.

Когда корпус относительно небольшой, задача разбивается на два этапа:

  • Превратите задачу в краткое текстовое семантическое представление, обычно tfidf, w2v.
  • Затем выполните вычисление семантического расстояния, например вычисление косинусного расстояния вектора.

Его преимущество в том, что он хорошо работает, когда корпус относительно небольшой.

3.4 Принцип робота QA (сопоставление QQ)

Здесь сопоставление QQ используется для представления принципа робота QA.

Сопоставление QQ включает в себя несколько частей: векторизацию предложений, вычисление сходства и ранжирование сходства.

  • Векторизация предложения заключается в использовании модели мешка слов BoW и расширении синонимов для преобразования слов предложения в векторы;
  • Затем вычислите сходство со словами в библиотеке вопросов, чтобы вычислить косинусное сходство;
  • Используйте косинусное расстояние, чтобы сгенерировать соответствующие результаты, и верните список ответов, отсортированных по сходству.

Векторы предложений представлены моделью мешка слов и расширением синонимов.

Что такое модель мешка слов? Модель мешка слов игнорирует порядок слов, словарный запас и синтаксис в тексте и рассматривает его только как набор слов и рассматривает его как набор слов.

Также было введено расширение синонимов. В реальных вопросах разные слова могут иметь разные способы задавать вопросы, но их семантика одинакова, поэтому некоторые синонимы эквивалентны, так что формируются векторы слов. Значения вектора — это значения TF-IDF, которые используются для представления весов.

Модель TF-IDF (частота термина – обратная частота документа, частота термина и обратная частота документа). TF-IDF — это статистический метод, используемый для оценки важности слова в наборе документов или корпусе. Основная идея TF-IDF заключается в том, что если слово или фраза часто встречается в одной статье и редко появляется в других статьях, считается, что это слово или фраза имеет хорошую способность различать категории и подходит для использования в Классификация.

TF-IDF имеет два значения: одно — частота слов, а другое — IDF (обратная частота документа, обратная частота документа). Рассчитывается, как показано на рисунке.

Например, в библиотеке 10 000 документов, 10 000 относятся к «корове», 10 из которых относятся к «молочной продуктивности», например текст о «молочной продуктивности коров», в этой статье 100 слов, появляется «корова». 5 раз и "молочная продуктивность" появляется 2 раза).

Путем вычислений было обнаружено, что, хотя частота слова «корова» высока, значение IDF очень низкое, и, наконец, TF-IDF слова «корова» очень низкое, что означает, что слово не имеет большой идентификации. Частота слова «производство молока» невысока, но легко узнаваема, и, наконец, его TF-IDF также высок.

Конкретный процесс выполнения показан на рисунке: сначала получить предложение, выполнить сегментацию слов, удалить стоп-слова и удалить дубликаты и получить последовательность слов. Затем просмотрите каждое слово для расчета TF-IDF.Если оно есть в тезаурусе, вычислите слово TF-IDF и рассчитайте среднее значение, если оно есть в тезаурусе, рассчитайте значение TF-IDF, если его нет в тезаурусе , игнорируйте его напрямую и, наконец, формируйте значение TF-IDF, соответствующее слову, и унифицируйте вектор Value.

Далее мы хотим вычислить расстояние между вектором и вектором, здесь мы берем косинусное расстояние. Метод расчета показан на рисунке.

Когда значение косинуса двух векторов слов близко к 1, два вектора слов подобны, то есть два предложения связаны. В противном случае это не имеет значения. Сходство предложений окончательно определяется вычислением значения косинуса.

Сопоставление QQ, представленное выше, является своего рода чат-роботом на основе поиска, а другая соответствующая классификация - это робот выражения, основанный на создании модели.

Чат-бот на основе поиска:

  • Отличительной чертой является то, что данные ответа являются предварительно сохраненными и известными (или определенными) данными.
  • Преимущество в том, что вопросы и ответы обобщаются вручную, что обеспечивает правильность ответов в базе данных, а выражения естественны и понятны.
  • Недостатком является то, что на всевозможные вопросы, задаваемые пользователями, роботы пытаются найти ответы в библиотеке; количество вопросов ограничено и не может охватить все вопросы пользователей; его необходимо постоянно обобщать и расширять, чтобы охватить большую часть вопросов. .

Чат-боты, генерирующие модели:

  • Функция заключается в создании нового неизвестного контента ответа (модель его не видела), аналогично технологии машинного перевода.
  • Преимущество в том, что он не требует предварительно сохраненных и определенных данных, что является более гибким и изменчивым, чем модель поиска.
  • Недостатком является то, что эффект генерации не очень хорош, и сгенерированные ответы могут иметь некоторые грамматические ошибки и семантически нерелевантное содержание; генеративные модели требуют больших обучающих данных и их трудно оптимизировать; результаты нельзя контролировать.

Текущий статус-кво заключается в том, что в коммерческой сфере промышленный стандарт по-прежнему будет использовать роботов на основе поиска, которые подходят для определенных областей, ограниченных наборов задач и некоторых вариантов, таких как графы знаний, роботы на основе KG и поисковая система. на базе роботов. Робот, создающий модели, находится в центре научных исследований, а в коммерческой сфере он будет использоваться в качестве дополнительной формы поискового робота.

3.5 Принципы чат-ботов

Чат-боты в основном ведут объективные тематические обсуждения, а пользователи выражают чат-ботам некоторые эмоции и отвечают на такую ​​информацию, как приветствия, эмоции и развлечения. Обработка светской беседы состоит из двух компонентов:

  • Сопоставление на основе заданных правил: требования корпоративной терминологии.
  • Основано на обширном корпусе чатов в библиотеке чатов: удовлетворите большинство ответов в чате.

Огромный корпус чатов можно сканировать с онлайн-форумов, разговоров в Weibo и даже с помощью других роботов общего назначения.

Требования к чат-ботам: простой чат, контролируемые результаты и быстрое развитие. Итак, с точки зрения реализации, мы создаем чат-бот на основе AIML.

AIML — это язык, изобретенный Ричардом Уоллесом. Он разработал робота по имени ALICE (Artificial Linguistics Internet Computer Entity) и получил несколько наград в области искусственного интеллекта. AIML — это формат XML, определяющий правила сопоставления шаблонов и определения ответов.

Возможности AIML очень гибкие, как показано на рисунке, он может быть основан на сопоставлении шаблонов, сопоставлении произвольных символов, извлечении элементов, множественных ответах на один вопрос и разделении тем.

Преимуществом AIML как носителя знаний является гибкость и сильная гуманизация. Недостатком является то, что порог для написания знаний высок, например, расширение библиотеки чата.

К счастью, есть готовые программы для редактирования AIML, такие как: SimpleAIMLEditor, GaitoBotAIMLEditor и так далее.

Спецификация языка AIML также постоянно обновляется, последней версией является AIML2.0.

3.6 Принцип рабочего робота

Ключевая технология Task-Bot основана на распознавании намерений и извлечении семантических слотов. Например, А сказал: «Помогите мне забронировать конференц-зал с 3:00 до 4:00 сегодня днем? Он должен быть больше». : время, место, размер.

После анализа было обнаружено, что в запросе задачи А отсутствовал семантический слот — местоположение, поэтому робот срабатывал, чтобы спросить: «Какое рабочее место вы хотите забронировать?» После того, как А добавил местоположение, робот подключился к системе бронирования встреч, чтобы забронировать конференц-зал и выполненное задание и сообщить о результатах А.

Этот процесс включает в себя: распознавание намерений, извлечение ключевых параметров, многократные диалоги и управление диалогами, настройку и стыковку с внешними системами.

Из фактического примера на приведенном выше рисунке этот пример предназначен для запроса атрибуции на основе идентификационного номера.

  • Сначала настройте возможные вопросы, как вы можете видеть здесь, чем больше возможных вопросов вы зададите, тем лучше робот сможет определить свое намерение. В основном это включает определение намерений и постановку возможных вопросов.
  • Затем настройте значение слота, которое необходимо извлечь.Значение слота исходит от сущности, а значением слота здесь является ID-карта. А если конфигурация не извлечена, то вопросы, которые нужно задавать. Извлечение значения тестового слота может быть выполнено онлайн.
  • Далее настраивается триггерная внешняя система.Здесь поддерживаются common post и get, и соответствующее значение слота отправляется в систему, а затем получается возвращаемое значение, и из возвращаемого значения извлекается необходимая информация для отображения правильного ситуация и неправильная ситуация.
  • Окончательный эффект показан на рисунке выше, и весь процесс включает в себя несколько раундов диалога и отслеживания тем.

3.7 Принцип сценического робота

Можно сказать, что сценический робот является более продвинутой версией рабочего робота, который предназначен для выполнения сценических задач на основе заданных правил.

В приведенном выше примере продавец G хочет проверить информацию о покупателе Ли Гоцяне.После того, как робот предоставит соответствующую информацию, он запускает процесс бизнес-рекомендаций, настроенный в фоновом режиме в соответствии с заданной сценой.В соответствии с этим процессом продавец может получить продукты, подходящие для клиентов Li Guoqiang.Рекомендации, изучение сопутствующих продуктов, проведение речевых упражнений и т. д. изначально были просто процессом чата, переходом к определенной сцене и связанной с бизнесом связью, которая является роботом сцены. Сценарии сценариев роботов и связанные с ними бизнес-переходы можно настроить так, чтобы можно было динамически поддерживать различные сценарии.

Сценический робот привязан к сцене в сочетании со связанными со сценой словами и правилами перехода и может выполнять: запрос портрета клиента, просмотр информации о продукте, отработку сцены, беседу лицом к лицу и т. д., а также может выполнять перекрестные действия. -Продажи и вопросы, связанные с клиентами.

3.8 Принцип робота KG

Роботы KG, а именно роботы графа знаний, по сути представляют собой семантическую сеть, узлы которой представляют сущности или концепции, а ребра представляют различные семантические отношения между сущностями и концепциями. Роботы KG дают результаты, основанные на рассуждениях на основе графа знаний, а также являются типом поискового робота.

По сравнению с обычным текстом граф знаний имеет следующие преимущества в системе ответов на вопросы.

  • Актуальность данных: степень семантического понимания является основным показателем системы ответов на вопросы. В графе знаний все точки знаний связаны ребрами с семантической информацией. В процессе сопоставления и корреляции точек знаний от вопросов до графов знаний может использоваться большое количество связанной информации связанных узлов. Такого рода связанная информация, несомненно, обеспечивает условия для более осмысленного семантического понимания.
  • Точность данных: уровень точности ответов высок, а знание карты знаний происходит из профессиональных аннотаций или отформатированного захвата профессиональных баз данных, что обеспечивает высокую точность данных.
  • Структура данных: Структурированная форма организации графа знаний для эффективности поиска, которая обеспечивает поддержку формата для быстрого поиска знаний компьютеров.

Все эти преимущества побуждают нас использовать граф знаний в качестве источника знаний для систем ответов на вопросы при создании интеллектуальной платформы чат-ботов.

Например, это граф знаний о страховании, который включает в себя: Атрибуты сущности запроса — сколько стоит Ping An внутренняя туристическая страховка в месяц? Отношения и атрибуты запроса - Какие страховки могут застраховать переломы и покрыть более 5 лет? Дознание Простая связь - Может ли Ping Внутреннее страхование путешествий покрыть случайные переломы? Запрос о сложных отношениях. Я хочу купить страховку, которая покрывает переломы и может быть возмещена в одной из трех лучших больниц в городе Хайкоу.

По сути, это выполнение запросов графа, запрос атрибутов сущностей, запрос сущностей и отношений между сущностями и т. д.

В процессе построения робота графа знаний:

  • Первым шагом является определение доменных знаний графа знаний. В приведенном выше примере мы эквивалентны объектно-ориентированному определению сущностей, атрибутов, отношений и т. Д. После отношений троек (сущностей, атрибутов, и отношения) определены, граф может быть построен Модель.
  • Следующим шагом является извлечение информации, Этот процесс включает в себя много обучения, онлайн-аннотации и т. д. Необходимо извлечь необходимую информацию из существующих форм и документов и импортировать извлеченную информацию в модель, построенную на первом этапе.
  • Тогда есть викторина знаний. Сущности, атрибуты и отношения должны быть извлечены из вопросов. В этом примере эквивалентом страхования от критических заболеваний является страхование от критических заболеваний, страхование от критических заболеваний является сущностью, и рак толстой кишки также является сущностью. Наконец, вопрос трансформируется в предсказание отношений между сущностями и сущностями.

Когда пользователь задает вопрос, вопрос преобразуется в расчет графа, а робот выполняет расчет запроса через граф знаний, преобразует его в ответ и возвращает пользователю.

3.9 Оркестровка модели

В дополнение к различным ботам, упомянутым выше, платформа чат-ботов также включает в себя часть оркестровки моделей и управления моделями. Например, некоторым предприятиям нужны только роботы QA.В настоящее время услуги могут предоставляться посредством предварительной обработки, вызова роботов QA и фильтрации по разрешениям ролей. В некоторых сценариях может потребоваться взаимодействие нескольких роботов, что включает в себя маршрутизацию/групповую отправку, и результаты групповой отправки роботов должны быть объединены.

Расположение моделей, объединение различных моделей, упорядочивание моделей, вызываемых визуальным способом, и поддержка конфигурации перетаскивания.

Сама модель нуждается в обслуживании. Сама наша фактическая модель представляет собой некоторые службы python. Мы инкапсулируем эти службы python и управляем ими унифицированным образом. Таким образом, мы можем определить унифицированный интерфейс для модели и выполнять автоматические обновления, такие как обновление через обучение модели по времени. модель, другие модели не затрагиваются, как показано на изображении выше, модель обновляется вручную и автоматически обновляется. В то же время мы можем выполнять модульное тестирование и тестирование ссылок.

3.10 Возможности интеллектуального чат-бота

В настоящее время платформа поддерживает:

  • Многофункциональные функции интеграции роботов, включая вопросы и ответы, задачи, чат и т. д.;
  • Сложный ситуативный разговор: включая функцию многораундового диалога, функцию отслеживания темы и т. д.;
  • Многоканальный робот интерактивный терминал;
  • Единая система управления роботами;
  • Совершенная поддержка возможностей обслуживания клиентов;
  • Полная регистрация данных и статистика.

3.11 Функция платформы робота

Основные функции платформы чат-ботов включают следующие аспекты.

  • Платформа для чат-ботов. На стойке регистрации платформы чат-бота есть такие функции, как ответ робота, контроль качества, поиск документов, поиск ассоциаций, автономные сообщения, история разговоров, часто задаваемые вопросы, приветствия и т. д. Фон включает в себя такие функции, как участие поисковой системы, настройки обратной связи, настройки внешнего вида, настройки сцены и конфигурация модели.
  • Искусственный бэкенд. Ручной фон включает в себя инструментальные средства обслуживания клиентов (онлайн-разговор, история разговоров, передача заказа на разговор, очередь разговоров, разговор с приглашением, отображение информации о клиенте, быстрый ответ и другие функции), управление обслуживанием клиентов, управление группой навыков и т. д.
  • Управление сеансом. Просматривайте экспорт сеансов, запрашивайте исторические сеансы, классифицируйте и оценивайте исторические сеансы онлайн и добавляйте вопросы контроля качества.
  • ОК/управление документами. Просмотр и редактирование, полнотекстовый поиск, классификация проблем, проблемы эквивалентности, пакетная загрузка корпуса, генерация водяных знаков и разрешения на просмотр документов.
  • Управление задачами. Для роботов-задач функции включают настройку задач, управление объектами, обновление задач, настройку модели и т. д.
  • Управление светской беседой. Функции чат-ботов включают управление библиотекой чатов, полнотекстовый поиск, экспорт корпуса и управление обновлением модели.
  • сообщить статистику. Включая статистику сеансов, статистику документов/QA, ручной анализ фоновых служб, рейтинг активности в облаке пользовательских вопросов, пользовательские баллы, охват поведения пользователей и т. д.
  • Управление моделями. Он включает в себя функции тестовой среды, такие как оркестровка модели, обновление запуска и остановки модели, автоматическое обслуживание и выпуск, а также прогнозирование модели.
  • Поддержка аутентификации/подключение к внешней системе. Включая стыковку PS, стыковку LDAP, стыковку SSO / стыковку различных внешних систем.

1) Робот на стойке регистрации

Робот имеет предустановленные интерактивные веб-страницы для поддержки всех функций робота. Включая диалог, обратную связь по сообщениям, перевод в рабочую силу, просмотр исторических сообщений; он может быть непосредственно встроен в бизнес-системы на стороне ПК и приложений и т. д.

Как вы можете видеть в приведенном выше примере, передний раздел — это наш список часто задаваемых вопросов, где пользователь задает вопрос, а затем находит ответ, соответствующий этому вопросу. Если вопрос, заданный пользователем, относительно прост, как показано на рисунке выше, дается только «Yirendai», и нет возможности задать независимый вопрос.В настоящее время, в дополнение к сопоставлению ответа, некоторые вопросы, связанные на вопрос также будет дано Это то, что мы называем проблемой ассоциации. Вы также можете перейти в поисковую систему, через вопросы, связанные с поисковой системой.

По сути, для чат-бота поисковой модели, когда в FAQ нет подходящего ответа, мы возвращаем вопрос в наиболее похожей паре вопрос-ответ в FAQ, а не ответ, чтобы пользователь мог задавать вопросы из FAQ. вопрос, чтобы получить больше информации, чтобы вернуть более правдивый ответ. На практике мы обнаружили, что пользователи могут найти ответы, которые им действительно нужны, всего за несколько кликов с помощью таких ассоциаций, и их удовлетворенность повысится.

2) База знаний

Это база знаний робота.База знаний содержит некоторую классификационную информацию, поддерживает соответствующие роли данных, цветовой формат данных документа, а также включает в себя такие функции, как просмотр и редактирование, полнотекстовый поиск, классификация проблем, пакетный загрузка, генерация корпуса и генерация водяных знаков.

3) Ручной фон

Это искусственный бэкэнд робота. После того, как ручной фон подключен к сети, пользователи могут общаться со службой поддержки клиентов вручную, а также загружать изображения в процессе. В отличие от робота Q&A, в режиме робота пользователь может только отправлять текст и общаться с персоналом службы поддержки клиентов, вы можете загружать документы, вставлять смайлики, запрашивать оценку и так далее. Здесь вы также можете делать быстрые ответы, просматривать базу знаний, базу документов, информацию о клиентах и ​​некоторые умные ответы.

Это функция рабочего места обслуживания клиентов.Вы можете вызвать соответствующего клиента из очереди для разговора.Если проблема не может быть решена, вы можете передать ее в обслуживание клиентов других рабочих мест для ответа.

4) Управление сессиями

Далее, давайте посмотрим на управление сессиями. В левой части изображения выше находится историческая информация о чате, относящаяся к этому человеку. Мы можем найти и найти вопросы, на которые, по его мнению, нет хороших ответов, а также быстро дополнить и добавить новые вопросы онлайн. Будет отображаться оценка каждого вопроса, что может помочь как коллегам по алгоритмам, так и коллегам по операциям поддерживать онлайн-информацию.

5) Статистический анализ

Платформа робота также предоставляет функции статистики и анализа данных.Эта функция основана на инструменте визуализации данных Davinci.Индикаторы данных можно настраивать, например, время обслуживания робота и выполнение услуги. Также может быть выполнена статистика отчетов: статистика сеансов, статистика QA документов, ручной фоновый анализ службы, облако вопросов пользователей, рейтинг активности, пользовательские баллы, охват поведения пользователя и сведения об использовании.

6) Управление моделями

Платформа роботов также предоставляет платформу для размещения обобщенных операций с моделями, которая представляет собой операционную архитектуру с высокой доступностью, которая может выполнять инкапсуляцию модели, выпуск, запуск и остановку и управление обновлениями, а также механизм автоматического обновления данных, унифицированный интерфейс доступа к услугам, и Т. Д.

7) Мультитенантность и ролевые разрешения

Платформа робота предоставляет функции мультитенантности и управления ролевыми разрешениями, а также обеспечивает автоматический импорт пользователей в компанию.При настройке соответствующих ролей и разрешений автоматически импортируются пользовательские ролевые разрешения робота. Таким образом, нет необходимости поддерживать самого пользователя, и он может напрямую подключаться к различным бизнес-системам.

Другие функции платформы роботов, такие как настройка задач, настройка чата, управление точками и подключение к внешним системам, здесь раскрываться не будут.

3.12 Этап разработки робота

Как показано на рисунке, на этапе разработки платформы интеллектуального чат-бота мы завершили создание функций робота на предыдущем этапе, включая вопросы и ответы, искусственный фон и т. д. В настоящее время мы находимся в процессе эволюции от третьего этапа к четвертому этапу, В конце концов, мы надеемся добиться систематической интеграции CUI в бизнес-сфере, то есть посредством разговоров роботов он будет отображаться клиентам в в виде сценических роботов и стать роботами-помощниками.

4. Сценарии применения интеллектуальной платформы чат-ботов

4.1 Интеллектуальный робот для обслуживания клиентов

Первоначальная цель интеллектуального робота для обслуживания клиентов — решить болевые точки отдела управления обслуживанием клиентов.

У CreditEase много офлайн-магазинов, и у продавцов в этих магазинах есть много вопросов, касающихся политики, правил, процессов, управления и многих других аспектов.На эти вопросы ответит отдел управления обслуживанием клиентов через инструмент внутренней коммуникации Bee или электронное письмо.

  • В процессе общения из-за большого количества людей и количества проблем много повторяющейся работы, сложно отслеживать проблемы, сложно накапливать знания, отсутствует статистика по проблемам, и целенаправленное обучение невозможно.
  • Для обслуживания клиентов и торгового персонала магазина время ожидания ручных ответов очень велико, что влияет на эффективность работы.Обслуживание клиентов склонно к раздражительности, а ручные ответы не являются стандартными.
  • Для клиентов время ожидания длительное, что сказывается на клиентском опыте, нестандартных ответах и ​​узнаваемости бренда.

После внедрения интеллектуальных роботов обслуживания клиентов 80% проблем перехватывались роботами, а оставшиеся 20% были переведены на ручной фон, что разгрузило менеджеров по обслуживанию клиентов.

Интеллектуальные роботы для обслуживания клиентов в настоящее время обслуживают всех коллег по работе с клиентами и становятся важным ежедневным инструментом для управления обслуживанием клиентов. Персоналу службы поддержки клиентов нужно только использовать мобильные телефоны для работы, реализуя процесс интеллектуального управления операциями от 0 до 1, помогая обслуживающему персоналу снизить нагрузку и повысить эффективность работы.

4.2 Интеллектуальный робот-помощник Fortune

Существует множество продуктов (фондов, страховок и т. д.), задействованных в процессе продажи богатства, и необходимо понимать знания о продуктах, правилах и правилах, а также методы продаж. Коллеги надеются получить помощника, основанного на знаниях, который поможет устранить многие пробелы в знаниях, возникающие в процессе продаж, и повысить профессионализм.

Мы планируем использовать помощника чат-бота в сочетании с существующим мобильным приложением, чтобы реализовать единый сервис для продуктов, клиентов и знаний.

Как показано на рисунке выше, Fortune Smart Assistant не вызывает платформу робота напрямую, а вызывает платформу робота через API, а затем задает различные вопросы для поддержки продаж.

В настоящее время робот-помощник Fortune Intelligent Assistant Robot охватывает весь персонал, занимающийся продажами и поддержкой бизнеса, решает такие проблемы, как прединвестиционная, инвестиционная, постинвестиционная и политика продаж, повышает профессионализм бизнеса, скорость реагирования и повышает эффективность развития бизнеса.

4.3 Страховой интеллектуальный робот

Третий сценарий — страховые интеллектуальные роботы. У пользователей WeChat много запросов, связанных с сопутствующими вопросами, а персонал слишком устал, чтобы отвечать, ответы не профессиональны, а стоимость рабочей силы высока. ручной труд, полное предпродажное информационное взаимодействие, а также значительно сократить расходы на персонал, а также повысить точность и четкость ответов.

Как показано на рисунке, интеллектуальный робот для страхования выдает запросы на основе сторонней базы знаний: включая запрос условий страхования, запрос к базе данных заболеваний, запрос о типе страхования, базу данных больниц и другую энциклопедию страховых знаний; запрос 1–3 степени на основе знаний график и рассуждения и т. д. Например: Положения и условия Могу ли я спросить, есть ли период колебания для этого продукта? Может ли мой 5-летний ребенок купить этот продукт? Какие заболевания покрывает страховка от критических заболеваний? Вы также можете сделать общие предпродажные и послепродажные суждения о намерениях и предварительно рассчитать страховые расходы.

4.4 Робот для эксплуатации и обслуживания AIOps

Последний сценарий — интеллектуальные роботы для эксплуатации и обслуживания AIOps.AIOps — это большая тема, связанная с хранением, анализом и обработкой массивных данных. Данные включают в себя: исторические данные, потоковые данные, данные журнала, данные временных рядов, аномальные данные и т. д. Вся система интегрируется в большую систему с помощью множества мелких инструментов. AIOps также включает в себя такие аспекты, как автоматическое обнаружение и прогнозирование закономерностей, проверка аномалий, анализ первопричин и т. д., которые требуют поддержки модели.

Здесь мы в основном фокусируемся на записи: вводе текста.

При ежедневной эксплуатации и техническом обслуживании, когда возникает неисправность, коллеги по эксплуатации и техническому обслуживанию получают сигналы тревоги с мобильных телефонов, электронной почты или текстовых сообщений.Они надеются использовать мобильное приложение для просмотра текущего состояния системы на естественном языке, понимания текущей системы в любое время и в любом месте и даже выполнить команду по эксплуатации и техническому обслуживанию, чтобы устранить неисправность.

Например, вы можете вызвать робота-задачу через приложение для мобильного телефона, чтобы запросить диаграмму последовательности занятия сети в фоновой системе и вернуть эту диаграмму во внешний интерфейс в виде отчета. Использование роботов может эффективно уменьшить проблему информационной перегрузки, вызвать соответствующие интерфейсы, напрямую найти наиболее важные проблемы в настоящее время и вернуться. При обнаружении системного сбоя робот может отправить команду на перезапуск службы для устранения сбоя.

V. Резюме

  • На основе мышления и практики ИИ среднего уровня. Интеллектуальный чат-бот использует метод построения на основе платформы, поэтому робота можно быстро скопировать. От разработки до запуска первого робота прошло 6 месяцев, затем 5 месяцев, 4 месяца, 2 месяца, 6 недель, а последний проект был запущен за 3 недели.
  • Поддержка нескольких бизнес-направлений, бесшовное подключение к системе и одновременное реагирование на индивидуальные потребности. С момента создания проекта продукт поддерживает многие важные деловые стороны инклюзивного управления финансами и активами компании, а также поддерживает стыковку терминала ПК, терминала приложения и спокойный интерфейс API.
  • Широкий охват коллег, длительный срок службы. Поддерживая десятки тысяч коллег, отвечая на вопросы более сотни тысяч раз и собирая разговоры в течение почти тысячи часов.
  • Эффект операции хороший, рабочая сила сохранена. По статистике, эффективный ответ (доля ответов робота в общем ответе) составляет более 80%, а процент ошибочных отзывов менее 5% (доля бесполезных отзывов).
  • Полный ассортимент продукции. Включая боты вопросов и ответов, чат-боты, боты задач, боты графа знаний и интерактивные боты на основе сценариев (такие как рекомендации по продуктам, анкеты, продажа коллекций и т. д.).
  • Предоставляет универсальное решение для интеллектуального чата, объединяющее разработку, алгоритмы и операции. Например, онлайн-просмотр сеансов аннотирования и обновлений знаний, автоматический экспорт корпуса и обновления моделей, данные, алгоритмы и операции образуют замкнутый цикл.

6. Вопросы и ответы

Q1: Как робот исходящей голосовой связи использует оценку качества языка на основе данных? Например, необходимо определить, какие речевые узлы часто не отвечают, прерываются или жалуются клиентам и т. д. Однако трансляция голоса робота содержит несколько переменных параметров, а хранилище текстовых разговоров расшифровывается в соответствии с голосом распознавания ASR, а конфигурация робота Формат фиксированных слов отличается, что приводит к очень большому масштабу предложения Как это посчитать?

A: Голосовой исходящий робот на самом деле является общим термином, обычно говоря, он будет специфичным для поля и в сочетании с конкретной сценой. Например: роботы для телемаркетинга, роботы для послепродажной экспресс-доставки, роботы для сбора голоса и т. д.

Возьмем, к примеру, робота-курьера послепродажного обслуживания, который оповещает клиентов с помощью голосовых вызовов и доставляет курьера на дом или в указанный кабинет курьера.

В данном конкретном сценарии главное расставить слова, а также затраты времени на расстановку слов.Необходимо полностью совместить характеристики бизнес-сцены, а робот будет задавать вопросы клиенту и классифицировать способы, которыми клиент может ответить (с конкретными). Деловая сторона может классифицировать и составлять статистику на основе возможных ответов существующих искусственных речевых методов, чтобы облегчить оценку речевых методов, таких как отсутствие ответа и жалобы.

Ответ конечного пользователя будет направляться в ограниченную речевую логику, чтобы достичь цели исходящих телефонных звонков. Предложения огромны по величине, но словарный запас ограничен и не особенно велик (словарный запас в нашем текущем сценарии суммируется в сотрудничестве с деловой стороной).

Кроме того, страница конфигурации этого робота-сценария не совсем совпадает с роботом-задачей, упомянутым в публикации, и имеет собственную конфигурацию словарного запаса.

Q2: Преподаватель упомянул об использовании подобных чат-ботов, такие чат-боты только распознают намерения, как быть с заполнением слотов?

О: Модели на основе подобия используются для ответов на вопросы и чат-ботов. Обработка задач роботами основана на специализированных моделях распознавания намерений и моделях распознавания сущностей.

Модель распознавания намерений, поскольку то, что мы хотим сделать, — это обобщение, самообслуживание и гибкость, мы разрабатываем легкую самообучающуюся структуру распознавания намерений, основанную на небольшом количестве корпусов, предложенных пользователями, извлекаем функции посредством анализа компонентов предложения и проанализировать функции.После анализа это в основном включает в себя лингвистические знания и небольшое количество статистических методов обучения.Преимущества в том, что для самообучения требуется небольшая вычислительная мощность, высокая интерпретируемость, высокая точность, и пользователи могут добавлять различные новые задачи по своему желанию.

Извлечение значения слота выполняется на основе анализа компонентов предложения в NER и распознавания намерений. NER поставляется с распознаванием общих сущностей, таких как время, место, имя человека и организация.Из-за достаточного корпуса общих сущностей его распознавание использует ML, DNN и другие модели. Кроме того, принимая во внимание объекты со значением специального слота в профессиональной сфере (такие как номер контракта, название внутреннего отдела компании, номер сотрудника и т. д.), мы позволяем пользователям самостоятельно настраивать объекты списка, обычные объекты и т. д.

Q3: Второй использует модель для определения намерений и слотов.Идентификация слотов на уровне символов или на уровне слов? Если это уровень слова, как решить проблему, вызванную неточным сокращенным словом?

A: Распознавание общих сущностей в значении слота основано на уровне слова, а распознавание проприетарных сущностей является более сложным.В обычных сценариях, если это сущность списка, мы добавили имя сущности списка к слову таблица сегментации на этапе сегментации слов, регулярные объекты напрямую соответствуют регулярным соответствиям.

Причина принятия этого метода NER заключается главным образом в том, чтобы уменьшить накладные расходы на каждую новую задачу, созданную пользователем, и самообучение структуры модели после сущности, чтобы она могла быстро и динамически загружать новые задачи распознавания намерений и значения слота. добыча.

Q4: С момента разработки до запуска первого робота прошло шесть месяцев, сколько времени ушло на разработку платформы для роботов?

A: Поскольку конструкция основана на платформенном мышлении, на самом деле, когда был разработан первый робот, модельная часть робота и платформа робота выполнялись синхронно.В состав команды входили коллеги по алгоритмам и коллеги по исследованиям и разработкам платформы, а также небольшой версия производилась каждые две недели.Скорость улучшения пользовательского опыта в любое время при сохранении тесной связи с первым заказчиком, в общей сложности заняла 6 месяцев, первая версия модели робота и платформы были завершены одновременно.

Первая версия в основном включает в себя основные функции, такие как робот QA, управление библиотекой QA, управление библиотекой документов, управление сеансами и автоматическое обновление модели. Чат-боты, роботы-задачи и т. д. постепенно добавляются в более поздних версиях.

По сути, модель робота, постоянное совершенствование библиотеки контроля качества, автоматическое обновление модели, обратная связь по проблемам и статистический отчет — все это единое целое. Простое внимание к любому аспекту, например, внимание только к моделям алгоритмов, игнорирование набора конкретных бизнес-сценариев и игнорирование операционной поддержки, приведет к тому, что роботы будут непростыми в использовании и неудовлетворительными. В реальной работе алгоритмы, платформы и операции должны образовывать замкнутый цикл для эффективной коммуникации. Только таким образом можно сделать платформу и роботов более удобными в использовании.

Источник: Технологический институт CreditEase.