Эта статья отредактирована и составлена на основе «Практики диалогового робота Smart Shopping Guide с открытым исходным кодом и снижением затрат», которым поделился г-н Мо Ю, соучредитель и технический директор Smart Point, в Салоне технологий искусственного интеллекта DataFunTalk «Natural Практика применения технологии обработки языка». внести изменения.
Прежде всего, давайте представим «умную точку», которая должна предоставлять интеллектуальные услуги по совершению покупок для клиентов электронной коммерции, и она больше склонна к предпродажному обслуживанию клиентов. Вышеизложенное является предысторией проекта.Сегодня я в основном расскажу о следующих аспектах.Создание интеллектуальных роботов-гидов для покупок объясняется с точки зрения регулирования (улучшение эффективности обслуживания клиентов) и открытого исходного кода (улучшение коэффициента конверсии клиентов).
Вышеприведенное изображение представляет собой скриншот сцены приложения, есть один раунд взаимодействия, такой как светская беседа и рекомендация одного раунда. Есть также несколько раундов взаимодействия, чтобы помочь пользователям выполнить задачу, и интерактивная рекомендация, которая будет подробно объяснена позже.
Далее поговорим о фоновой службе приложения.Средняя часть является основной частью диалогового робота, который в основном включает в себя центральную управляющую часть.После получения запроса клиента вызывается служба понимания естественного языка для выполнения семантического понимания пользователя ввода, а затем распространяется на множество небольших роботов.Эти маленькие роботы включают в себя чат, вопросы и ответы, роботы-задачи и роботы-рекомендации. По нынешним техническим причинам роботы не могут полностью заменить людей, поэтому используется метод совместной работы человека и машины. Когда робот не может ответить на запрос пользователя, задача распределяется, и персонал по обслуживанию клиентов решает проблему пользователя. Диалоговые роботы достигают разных пользователей по разным каналам, таким как Ali Qianniu, общедоступная учетная запись WeChat, веб-сайт или приложение.
Далее мы представим проделанную нами работу с двух аспектов: дросселирование и открытый исходный код, Прежде всего, с точки зрения дросселирования, наиболее проделанной является робот вопросов и ответов. Один раунд вопросов и ответов без учета контекста на данный момент или ответы на вопросы пользователей после некоторой обработки во время нескольких раундов взаимодействия. Есть три формы: одна - это форма, основанная на библиотеке вопросов и ответов, заранее есть много пар вопросов и ответов, когда пользователь задает вопрос, как найти ответ, чтобы ответить пользователю. Во-вторых, найти предложение в библиотеке документов, чтобы ответить на вопрос пользователя, что отличается от понимания прочитанного, то есть ответить пользователю на сущность в документе. В-третьих, построить граф знаний на основе графа знаний и получить соответствующую информацию из графа знаний, чтобы ответить пользователю в соответствии с вопросом пользователя.
Большинство интеллектуальных ответов на вопросы основаны на вышеупомянутой аналогичной структуре.Во-первых, семантическое понимание выполняется на основе вопросов пользователей, наборы кандидатов получаются в соответствии с модулем поиска и, наконец, сортируются в соответствии с модулем ранжирования.Модуль архитектуры очень похоже на поисковик. Модули поиска и ранжирования также можно использовать для улучшения соответствия и ранжирования в поисковых системах.
Первый метод основан на интеллектуальных ответах на вопросы библиотеки ответов на вопросы, в основе которых лежат два вопроса, в чем смысловое сходство. Удаление предварительной обработки можно рассматривать в двух измерениях: во-первых, чтобы выразить смысл вопроса с точки зрения семантического выражения, а затем сходство вычисляется в соответствии с двумя семантическими выражениями. Например, проблема может быть преобразована в модель заимствования слов или могут быть использованы некоторые методы неконтролируемого семантического представления или методы контролируемого семантического представления. В основном задача преобразуется в семантическое представление, а затем решается подобие семантического представления. Во-вторых, непосредственно смоделировать и рассчитать сходство между двумя задачами, такими как расстояние Жаккара, расстояние редактирования, WMD (Word Mover Distance, опираясь на концепцию EMD), или преобразовать его в форму графика. Мы можем комбинировать разные модели, чтобы наконец решить проблему такого рода, чтобы увидеть, имеют ли эти две проблемы одно и то же значение.
Во-вторых, найти соответствующее предложение из документа для ответа.Во-первых, мы смоделируем представление вопроса и представление предложения, а также примем некоторые традиционные функции, такие как рассмотрение того, содержит ли ответ местоположение, является ли вопрос место консультации и т.д. Традиционные функции, а затем в сочетании с функциями глубокого обучения для построения модели.
Однако в реальных сценариях применения пользователи задают разные вопросы, например, пользователи будут задавать много вопросов о размере, если параметры расширять, то они будут экспоненциальными. Кроме того, если завтра запланировано событие, вопрос сегодня отличается от запроса завтра. Если метод вопросов и ответов, основанный на предыдущей библиотеке вопросов и ответов, не может поддерживаться, вопрос и ответ, основанные на графе знаний, более важны. Третий метод обычно включает в себя три типа проблем: первый — как построить граф знаний, как построить граф знаний из структурированных данных, неструктурированных данных и полуструктурированных данных, второй — как понять вводимые пользователем вопросы; в-третьих, как генерировать ответный ответ. Для последних двух проблем, как правило, есть два общих решения: первое решение состоит в том, чтобы сначала понять предложение, а затем преобразовать его в запрос к базе данных и ответить в соответствии с результатами запроса; второе решение — это модель, принятая Версоном IBM, с упором на на какой тип ответа на вопрос, который затем поддерживается методами поиска и сортировки.
Наше решение состоит в том, чтобы интегрировать предыдущие три решения.Например, при интеллектуальном ответе на вопрос самое простое решение состоит в том, чтобы только рассмотреть, является ли значение вопроса таким же. На самом деле, мы можем сначала судить, совпадает ли смысл вопроса, или мы можем использовать второй способ, отвечает ли ответ на вопрос, поэтому мы можем рассмотреть больше информации. Затем используйте модель LR, чтобы объединить больше функций.
На самом деле, во многих случаях есть несколько раундов диалога.Если вы хотите поддерживать ядро диалога Duolun, как поддерживать состояние диалога. Необходимо понять, какое намерение пользователя основано на контексте, и используются два типа методов: один — непараметрическая модель, которая аннотируется на основе приблизительных данных, другой — метод использования модели. Первый более контролируемый, а второй более универсальный. В приложении есть много проблем, например, исторические данные обучения — это данные о взаимодействии перед выходом системы в онлайн, а сцена диалога с пользователем изменится после выхода системы в онлайн. Существует два способа извлечения объектов: один основан на правилах, а другой — на аннотации последовательности.
Управление диалогами обычно делится на две категории. Одна представляет собой предопределенную структуру графа, которая поддерживается предварительным определением. Состояние диалога может быть определено идентификатором. Каждый узел является состоянием, а передача или ответ каждого узел обязателен Тексты предопределены системой. Таким образом, систему трудно поддерживать, особенно при наличии многих состояний. Вторая — это архитектура на основе фреймов, которая представляет состояние как комбинацию слотов, а оптимизация состояния политики и генерация текста выполняются с помощью связанных конфигураций, тем самым реализуя разделение дизайна и реальности. Например, робот-гид по магазинам, разработчик не является хорошим конструктором разговорных роботов, и эксперты по гидам по магазинам могут реализовать свои идеи через эту платформу. Цель состоит в том, чтобы позволить экспертам по покупкам не нужно знать технологию для реализации дизайна платформы для взаимодействия с пользователем, каких целей достичь, как взаимодействовать и как взаимодействовать с конфигурацией поддержки интерактивной платформы. Платформа управления поддерживает информацию о деятельности продукта, и вся соответствующая информация будет введена в граф знаний для формирования графа. Разработка единого языка описания требует сильной выразительной способности, а система диалогового взаимодействия проводит окончательное взаимодействие на основе языка описания и графа знаний. Технические специалисты сосредоточены на том, как создать язык описания с сильными выразительными возможностями, а дизайнеры сосредоточены на улучшении взаимодействия с пользователем. В электронной коммерции наблюдается прилив, и между обычными действиями и действиями существует большая разница.В обычное время спрос на роботов-гидов по покупкам выше, и необходимо повысить коэффициент конверсии клиентов.
Повышение коэффициента конверсии клиентов не только помогает пользователям экономить деньги, но и помогает им зарабатывать деньги Как совместить взаимодействие и рекомендации для повышения коэффициента конверсии. Перед CUI у GUI есть много преимуществ перед CUI, таких как: отображение информации GUI лучше, точность работы GUI выше, в основном 100%, но CUI трудно достичь 100%. Тем не менее, CUI легче получить информацию, чем GUI.GUI обслуживает информацию заголовка, и трудно получить длинную информацию.Например, трудно найти платеж без пароля в Alipay. С точки зрения пользователя необходимо сочетать преимущества обоих. Кроме того, существует острая потребность в персонализации сценариев диалогового взаимодействия. В целом очень важно интегрировать персональные рекомендации в диалоговую сцену.
Чем отличаются рекомендации во время разговорного взаимодействия. Традиционные рекомендации во многом основаны на неявной обратной связи, такой как просмотр Toutiao, Douyin и т. д., и будут судить о том, заинтересованы ли вы в продукте, на основе просмотра, кликов, покупок и другой информации. Однако в процессе диалогового взаимодействия можно объединить более богатую информацию и получить явную обратную связь, например, когда вы идете в ресторан поесть, официант спрашивает вас, что вы хотите съесть, что является явным Обратная связь. Рекомендации в процессе руководства по покупкам включают в себя: популярные рекомендации, связанные рекомендации и активные рекомендации, такие как напоминания/запросы, рекомендации о недавних связанных действиях и рекомендации по купонам. Например, если покупатель покупает 90 штук подгузников размера S, а ребенок, пользующийся подгузниками размера S, потребляет много подгузников каждый день, то мы можем порекомендовать ему купон на подгузники на седьмой или восьмой день; а для размера L, необходимо Релевантные рекомендации и купоны будут инициированы через 30-40 дней.
На самом деле информация в диалоговом процессе асимметрична, поэтому обмен информацией осуществляется через диалоговое взаимодействие. Например, пользователь не знает, какая информация есть у продавца, а продавец не знает, каковы предпочтения пользователя, поэтому как компенсировать эту асимметрию посредством информационного взаимодействия и облегчить транзакции. Основная часть использует метод Q20, сначала давая пользователям рекомендацию, а затем взаимодействуя и рекомендуя. Например, пользователь хочет купить мобильный телефон, Пользователь: Я хочу купить мобильный телефон, есть рекомендации? , Бот: Уважаемый, какую цену вы хотите видеть? , Пользователь: Ниже 1000, Бот: Есть мобильные телефоны Huawei, Xiaomi, Meizu по этой цене, какую марку вы хотите видеть? , Пользователь: Xiaomi's, Бот: Рекомендую вам взглянуть на Redmi (URL) и Redmi Pro (URL).
Базовый процесс — начать без каких-либо ограничений, а затем сделать рекомендацию на основе ограничений до выполнения условий завершения.Второй шаг — выбрать параметры следующего взаимодействия, с чем нужно взаимодействовать, а затем сгенерировать пользователя. ответ, и найти новый через семантическое понимание.Ограничения, затем комбинировать и повторять на основе новых ограничений. В товарном типе могут быть разные типы, самый простой – это детерминированный товар, но он имеет разные атрибуты, или это может быть сборный продукт, содержащий разные части. Существует также часть обратной связи.В прошлом GUI основывался на лайках/рейтингах, предпочтениях и т. д., а CUI основывался на консультациях по атрибутам. В этом есть некоторые проблемы, которые влияют на эффективность конверсии. Что мы рекомендуем пользователям? Если взаимодействий слишком много, пользователям будет противно. Почему вы задаете мне так много вопросов? Выберите тот, который содержит наибольшее количество информации для рекомендация. Вы можете использовать статические стратегии и динамические стратегии. Стратегия, статическая стратегия заключается в том, чтобы спросить всех людей об атрибуте А, а затем спросить об атрибуте Б, динамической стратегии, например, предпринимать разные действия для разных отзывов об А. Персонализация также может быть рассмотрена, если человек каждый раз покупает товары определенной марки, нет необходимости сообщать о своих предпочтениях в отношении бренда.
Например, «Пользователь: Новорожденный, у вас есть подгузники, которые вы можете порекомендовать?», Бот: У нас есть несколько серий подгузников, вы хотите ультратонкие или ультрамягкие?, Пользователь: В чем разница между ультратонкими и ультрамягкими? ультра-мягкий? • Бот: Ультратонкий..., Ультрамягкий..., Пользователь: Посмотреть Ультратонкий?, Бот: Рекомендовать..." Диалог вернется, что очень часто, это на самом деле пересечение или смещение нескольких намерений, решение Треугольник на приведенном выше рисунке показывает, как интерактивная платформа поддерживает активность сцены. Может быть много незавершенных продуктов. Когда пользователь вводит его, оценивается, является ли это новым намерением. Новое намерение создает новую сцену и добавляет новую сцену в стек. Если это В старой сцене, определите, какое это старое намерение, а затем взаимодействуйте. После завершения взаимодействия соответствующая сцена вынимается из стека. Этот метод поддерживает переключение между разными намерениями. Также существует ситуация, когда вы не можете ответить во время взаимодействия, чтобы избежать слишком технических выражений во время взаимодействия. Это включает анализ отзывов, извлечение пользовательских тегов или описаний продуктов.
Во многих случаях его инициирует пользователь, но иногда его инициирует робот, например: «Бот: Недавно мы запустили новый продукт, хотите узнать о нем? • Пользователь: Какой тип курьера вам нужен? использовать у себя дома? • Бот: Cainiao через Tmall Mall Случайная экспресс-доставка со склада.• Бот: Новый продукт, понятно?• Пользователь: ОК• Бот: balabala• Пользователь: balabala», это решение разделено на уровень стратегии и уровень намерений. . Робот инициирует диалог в соответствии с определенной стратегией и инициирует активное намерение.Когда пользователь отвечает с активным намерением, сценарий выполняется в соответствии с активным намерением.Если намерение пользователя не находится в активном намерении, он взаимодействует в соответствии с пассивное намерение. После пассивно-намеренного взаимодействия активное намерение продолжается по определенной стратегии, таким образом реализуется сочетание активной инициации робота и пассивного диалога.
Наконец, подводя итог, мы разделим робота-гида на трех роботов, самый простой из которых — робот «вопрос-ответ» — однораундовая ситуация, на этой основе реализовано несколько раундов диалога, а многораундовый диалог будет трансформироваться в однораундовую ситуацию по определенной стратегии; на основе активного диалога и интерактивных рекомендаций. В соответствии с тремя различными атрибутами этих трех роботов (однократный, многократный, активный) достигается цель не только помочь пользователям сэкономить труд, но и повысить коэффициент конверсии.
——КОНЕЦ——Общественный идентификатор: datafuntalk——