Глубокое обучение: анализ применимых сценариев и технологий интеллектуальных диалоговых роботов

Источник контента:24 сентября 2017 г. Ву Цзиньлун, партнер Ain Interactive Technology, выступил с речью на тему «Робот с глубоким обучением и интеллектуальным диалогом» на «Пекинской станции ArchData Technology Summit». IT Dajiashuo (идентификатор WeChat: itdakashuo), как эксклюзивный видео-партнер, имеет право публиковать видео после просмотра организатором и спикерами.

Количество слов для чтения:2390 | 6 минут чтения

Видео с гостевым выступлением и обзор PPT:suo.im/4rwwLi

Резюме

В этой теме будет представлено сочетание глубокого обучения и диалоговых роботов, а также проанализированы тенденции развития и применимые сценарии диалоговых роботов посредством анализа различных технологий диалоговых роботов.

Краткая история разговорных роботов

Самый ранний искусственный интеллект был предложен в «Тесте Тьюринга» в 1905 г. После этого были попытки создания чат-роботов. Одной из них была ELIZA в 1966 г. Она приняла очень простой режим сопоставления ключевых слов, а затем появилась более сильная ALICE в 1995.

С 2011 по 2012 год многие иностранные компании одна за другой пытались исследовать искусственный интеллект, в это время родились Siri и Google Now. В 2015 году искусственный интеллект вступил в период взрывного роста, в эту сферу один за другим были вовлечены Microsoft и Amazon, 2016 год стал самым жарким для искусственного интеллекта, который назвали первым годом бота.

Несмотря на то, что чат-боты находятся на ранней стадии, вся индустрия уже достаточно развита, и компании участвуют в таких областях искусственного интеллекта, как обработка речи, обработка текстов и личные помощники.

Будущая тенденция разговорных роботов

Помощник по личной информации, который помогает пользователям управлять расписанием, планировать встречи и помогать в письменной форме.

Робот обслуживания клиентов / гида по покупкам, пользователи получают необходимую им информацию, общаясь с чат-роботом.

Развлекательный / образовательный чат-бот, который может сопровождать пожилых людей и обучать детей.

Диалоговое окно DeepBot

У Ain Interactive есть множество продуктов для чат-ботов как внутри компании, так и за ее пределами, поэтому мы запустили диалоговую структуру DeepBot на уровне алгоритма, которая реализует использование разных ответов роботов для разных ситуаций, и каждый робот принимает свою соответствующую модель функции.

Когда робот получает проблему, он анализирует ее, и анализ включает в себя обнаружение злонамеренных действий, распознавание объектов, классификацию проблем и т. д. После завершения анализа Route Bot определит, какой бот ответит. Далее идет ботлет, у каждого ботлета есть своя часть, которую можно обработать, а та часть, которую нельзя обработать, будет передана другим роботам. Когда боты обработают вопрос, технология слияния оценит качество ответа бота и решит, какой ответ бота использовать.

Анализ проблем — распознавание сущностей

Распознавание сущностей используется для извлечения ключевых частей пользовательских проблем. Оно началось с ранней маркировки последовательностей, а затем испытало развитие HMM / CRF, LSTM и BiLSTM-CRF. Можно сказать, что это технология, которая была сохраняется в течение длительного времени.

Route-Bot — Обнаружение домена/намерения

Две основные части сравнения Route-Bot — это определение домена и намерения. В модели одноэтапного распознавания RNN/CNN используется для выражения предложений в виде векторов, а затем DNN используется для классификации. Многоэтапное распознавание относительно сложно, не только для распознавания того, что пользователь в данный момент говорит, но и для анализа текущей языковой среды. Для этого у нас есть специальный механизм многоэтапного распознавания, его базовым модулем по-прежнему является RNN/CNN, который используется для обработки одного выражения предложения, а для обобщения информации добавляется дополнительный уровень RNN.

FAQ-Bot

Основной технологией, используемой в FAQ, является поиск и извлечение.Обычная логика состоит в том, чтобы проанализировать проблему, затем выбрать модули-кандидаты через модуль поиска и, наконец, использовать соответствующий модуль для сортировки частей-кандидатов.

В отличие от обычных FAQ, мы добавили функцию семантического сопоставления в FAQ и можем добавить предысторию вопроса и параметр в ответ.

Task-Bot

Task-Bot будет получать разнообразную информацию, генерируемую при взаимодействии пользователя с системой, и на основе этой информации определять, какой ответ система выдаст в следующий раз. Его типичная системная структура: SLU -> DST -> DPO -> NLG, SLU отвечает за перевод языка пользователя в структурированную информацию, DST отслеживает историческую информацию о диалогах пользователей, DPO получает текущее состояние диалога в соответствии с результатами DST и дает ответ. , NLG преобразует структурированную информацию, выводимую DPO, в естественный язык.

Rec-Bot

По сравнению с рекомендацией через графический интерфейс более выгодно использовать диалоговый метод, поскольку этот метод позволяет пользователям изменять информацию в режиме реального времени. Рекомендации в основном включают три аспекта: предприятия, продукты и пользователи. Рекомендация, которую мы даем с помощью голосового робота, включает три модуля: офлайн, почти в реальном времени и в реальном времени. Обновления в автономном режиме производятся ежедневно, и своевременная обратная связь о поведении пользователей предоставляется практически в режиме реального времени.

Наиболее важными данными в рекомендации являются данные о взаимодействии между пользователем и системой, в коллаборативной фильтрации наиболее часто используются данные о взаимодействии между пользователем и продуктом, а затем взаимодействие между пользователем, спросом и продуктом, а также взаимодействие между пользователем и пользователем.

По сути, рекомендуемые модели используются для характеристики пользователя и характеристики продукта. Характеристика - это использование обучения пользователя для получения различных функций, связанных с пользователем, а затем они представляют краткосрочные потребности, а долгосрочные результаты используются для прогнозирования потребностей пользователя. Каждый продукт содержит основную информацию, такую как цена и услуга, помогает довести этот продукт до пользователя, чтобы купить продукт и другие поведенческие данные также могут быть скрыты, характеризуют этот продукт, который характеризуется продуктами.

На сегодняшний день наиболее используемой рекомендательной системой является слияние, появившееся в результате конкурса Netflix Prize. Обычно используемые комбинированные методы включают в себя комбинирование предсказанных значений, объединение предсказанных значений нескольких алгоритмов; расширение признаков, когда выходные данные одного алгоритма используются в качестве входных признаков другого алгоритма; переключение, переключение между разными алгоритмами.

Рекомендуется, чтобы помимо требования к точности присутствовали и другие показатели, такие как охват, разнообразие, новизна, неожиданность и т. д.

Chitchat-Bot

Chitchat-Bot использует комбинацию технологий поиска и генерации, поиск может обеспечить надежность, позволяет пользователям добавлять пары qa и вступает в силу за считанные секунды. Генератив гарантирует 100% отзыв, может ответить на любой вопрос и снизить порог обслуживания базы знаний.

Чтобы решить некоторые общие проблемы Chitchat-Bot, мы используем механизм CoverAge в Chitchat-Bot, чтобы гарантировать, что сгенерированные предложения не повторяются, а также используем механизм копирования, чтобы обеспечить генерацию редких слов, и используем MMI для улучшения разнообразие получаемых результатов.

Опыт

CUI/GUI

С точки зрения эффективности, GUI больше подходит для отображения обширной информации, а CUI — для отображения углубленной информации. С точки зрения ощущений, графический интерфейс имеет более сильное ощущение пространства, а CUI — более выраженное чувство времени. Основываясь на двух вышеприведенных пунктах, мы считаем, что CUI больше подходит для рекомендаций или индивидуальных потребностей.

Следует отметить, что сам CUI не приносит прямого значения, а через вход в пользователь взаимодействует, косвенная ценность.

Принципы разговорного бизнеса.

- Ценность для пользователя: может эффективно решать проблемы посредством диалога

- Дефицит: стать ключевым деловым звеном в сегменте

- Технологическая зрелость: выберите правильную технологию

Разговорные бизнес-сценарии

- Четкая структура знаний и границы

- Нестандартные услуги, информационная асимметрия

- Возможность повышения качества обслуживания за счет накопления данных

- Способность создавать знания и технические барьеры