Технологии и вызовы диалоговой интерактивной системы чат-ботов в эпоху ИИ

искусственный интеллект глубокое обучение API робот
Технологии и вызовы диалоговой интерактивной системы чат-ботов в эпоху ИИ


Источник контента:17 апреля 2017 года Ву Цзиньлун, партнер Ain Interactive Technology, выступил с речью на тему «Анализ и применение диалоговой интерактивной системы в чат-ботах» в разделе «Последние достижения и практика глубокого обучения». IT big coffee сообщил, что как эксклюзивный видео-партнер, он был выпущен с разрешения организатора и спикера.

Количество слов для чтения:2233 | 5 минут чтения

Гостевой PPT и речевое видео: http://t.cn/Rplb9Z2

Резюме

В течение долгого времени способ взаимодействия человека с компьютером постоянно меняется, от взаимодействия с командной строкой, взаимодействия с графическим интерфейсом, взаимодействия с графическим интерфейсом + до диалогового взаимодействия (CUI). В прошлом традиционное взаимодействие заключалось в том, что люди приспосабливаются к машине, а CUI реализует приспособление машины к человеку. В этом докладе будет представлена ​​общая структура технологии диалогового взаимодействия, а также на практике будут представлены технологии и проблемы, связанные с системной платформой чат-ботов.

Краткая история чат-ботов


Три мушкетера: Три рама бота

IR-Bot: интеллектуальный поисковый робот


Структура интеллектуального поиска похожа на структуру поисковых систем. Первый шаг анализа проблем включает в себя распознавание сущностей, классификацию проблем, разрешение метафор, извлечение отношений и анализ настроений.

После завершения первого шага выполняется поиск, и соответствующие вопросы извлекаются из соответствующих вопросов в библиотеке. Наиболее традиционным способом здесь является использование слов, если слово появляется как в вопросах пользователя, так и в вопросах библиотеки, я думаю, что они связаны. Более сложные поиски можно выполнять с помощью векторов слов. Поиск — это поиск соответствующих вопросов или ответов, связанных с вопросом пользователя в библиотеке. Во многих случаях будет использоваться база знаний или граф знаний, связанных с предметной областью и приложением, что будет соответствовать анализу и поиску проблемы.

Полученные уровни-кандидаты будут отсортированы, и самая простая сортировка — это TF-IDF. Теперь есть больше технологий, таких как основанные на ранжировании и связанные с LtR и глубоким обучением CNN / RNN.

Окончательный ответ дается после сортировки.


На основе CNN/RNN превратите вопрос или ответ в векторное представление. Левый кадр на приведенном выше рисунке — это выражение применения CNN к предложению и превращения предложения в вектор. Таким образом, теоретически могут быть достигнуты долгосрочные отношения между словами.

После получения векторного представления вопроса и ответа мы можем использовать другие фреймворки для сопоставления. Например, в кадре справа на изображении выше X — это вопрос, а Y — ответ. Два вектора получаются путем извлечения CNN, а затем они преобразуются в вычисление оценки сходства.Наконец, если оценка высока, мы думаем, что они относительно совпадают.


Получить вопросы и зависимости между вопросами. В левой рамке рисунка выше оба вопроса являются векторами слов, а затем оценивается их сходство. Кадр справа немного сложнее и может определять расстояние между двумя векторами и щелчок между ними.

Это общие рамки для сопоставления вопросов или ответов, где глубокое обучение было относительно зрелым.

Task-Bot: Бот для обсуждения задач

Диалоги, обычно используемые для ведения диалога с несколькими людьми или диалога с несколькими людьми на основе задач, называются роботами на основе задач, а полное название - роботы, ориентированные на задачи.


На основе первой части общей структуры, ориентированной на задачи, после ввода пользователь входит в модуль понимания. Модуль понимания в основном включает в себя распознавание речи и понимание языка. Распознавание речи заключается в распознавании речи пользователя в тексте, а понимание языка — в анализе естественного языка, распознаваемого речью, в структурированные данные.



Результаты понимания языка будут выводиться в модуль понимания диалогов, который включает в себя два модуля: отслеживание состояния диалогов и оптимизацию политик.

Поскольку структура, основанная на задачах, в основном предназначена для разговоров с несколькими людьми, нам нужно помнить, что пользователь сказал в предыдущих раундах или ответы, данные системой в предыдущих раундах.Что делает отслеживание состояния диалога, так это соединяет пользователя и Записывается историческая информация, связанная с взаимодействием.

Оптимизация политик — это метод определения того, как система должна отвечать на последний вопрос пользователя в соответствии с текущим состоянием. Результатом оптимизации политики является структурированное представление. Состояние диалога должно содержать все виды информации, необходимой для непрерывного диалога, и обновлять состояние диалога в соответствии с последними действиями системы и пользователя в системе.

В модуле генерации есть генерация языка и синтез речи. Генерация языка — это перевод структурированной информации на естественный язык, и пользователю возвращается то, что легко понять. Синтез речи – это синтез текста в речь.


С прошлого года появилось много других сквозных фреймворков. Это обычно используемые технические рамки, основанные на задачах, основанные на нескольких диалогах.



Chitchat-Bot: чат-бот с открытым доменом

Чат-бот с открытым доменом — это наиболее быстро развивающееся направление в области глубокого обучения, а широко используемой структурой является модель перевода.


Но помещать модель перевода прямо в него не так хорошо, как ожидалось.Самая большая проблема в том, что легко генерировать безопасные ответы.

В целевой функции есть три соображения:

Разговор легче продолжить, что снижает вероятность ответов «я не знаю».

Принесите новую информацию, чтобы полученные ответы отличались от предыдущих.

Семантика должна быть последовательной. Добавьте взаимную информацию: также учитывайте вероятность от ответа к вопросу.

Есть и другие факторы, которые следует соблюдать осторожность при обучении данным, а также о том, как вводить контекстную информацию, как включать внешнюю информацию и как генерировать персонализированные ответы.

Резюме: три платформы ботов

Если IR-Bot имеет пятибалльную зрелость, то Task-Bot имеет трехбалльную зрелость, а Chitchat-Bot — одну зрелость.

IR-Bot основан на процессе поиска/сортировки с долгой историей и зрелой технологией. Внедрите глубокое обучение, примите во внимание долгосрочные зависимости и создайте лучшие выражения предложений.

Task-Bot — это фреймворк, подходящий для решения задач, в котором подчеркивается логика множественных раундов вопросов и ответов.

Chitchat-Bot — это новая область и новый этап глубокого обучения в НЛП. Его нынешний уровень совершенства все еще очень низок, и впереди еще долгий путь. Но его развитие также очень быстрое, каждый год в чате открытого домена публикуется много статей.

EIN+: Углубленный индивидуальный диалоговый сервис

EIN+ — это небольшая начинающая компания, которая предоставляет решения для диалога с использованием искусственного интеллекта для других предприятий, экспортируя диалог как услугу.

Сценарии применения бота

Существуют четкие структуры знаний и границы.

Сценарий приложения представляет собой нестандартизированный сервис с асимметричной информацией.

Качество обслуживания может быть улучшено за счет накопления данных.

Способность создавать знания и технические барьеры.

Общение действует как связующее звено, связывая пользователей и соответствующие продукты и повышая коэффициент конверсии пользователей в продукты.

Ain Interactive: API на входе, API на выходе

Модель интерактивного сотрудничества Ein — это, по сути, путь API. Партнеру нужно только предоставить исходные данные, мы создадим соответствующую базу знаний и корпус вопросов и ответов, а затем поместим их в фоновую структуру алгоритма EinBot и, наконец, сгенерируем соответствующий системный API, партнеру нужно только позвонить наш API.

Быстрое подключение различных API

Ein Interactive предоставляет множество методов API, таких как Ein API, Wechat, BearyChat и другие. При наличии у партнеров определенных возможностей разработки рабочий чат-бот может быть запущен примерно за неделю.


откровение

Если вы не можете понять вопрос, попробуйте дать правильный ответ. Если можно определить ключевые слова, можно получить более гуманизированные ответы; стереотипы основаны на заданном отрывке для ответа на соответствующие вопросы.

Используйте разные методы для разных проблем.


Резюме методов сотрудничества

Быстрое развертывание, глубокая настройка. Непрерывная итерация, сначала значение.

Резюме: целый новый мир

тенденция

В настоящее время появляется все больше и больше интеллектуальных устройств, от людей, вмещающих машины, до машин, вмещающих людей. Разработка графического интерфейса очень эффективна, но она также приносит нам сильное чувство одиночества. Вопрос о том, может ли CUI вернуть нам счастье, еще предстоит изучить.

Ценность разговорных взаимодействий: где/там

Диалоговое взаимодействие все еще находится на ранней стадии развития отрасли, помимо относительно зрелой технологии, есть еще много незрелых аспектов, ценность которых еще предстоит проверить.

Текущая технология ограничена, и необходимо определить разумные потребности и уменьшить соответствующие потребности партнеров.

Дизайн диалога более элегантен, чтобы служить своей цели.

Мы надеемся сделать то, что можно сделать и стоит того, исходя из настоящего, и стремимся сделать то, что невозможно сделать, выполнимым.

На этом мы заканчиваем сегодняшнюю беседу, всем спасибо!