Как использовать технологию НЛП для построения портретов клиентов в бизнесе.
Создание портретов клиентов в сложных сценариях
На многих предприятиях ежедневно создается большое количество записей при общении между бизнес-персоналом и клиентами.Эти записи могут включать в себя данные связи службы поддержки клиентов (записи вызовов, сводки вызовов), а также могут включать в себя различные отчетные данные (сопроводительный отчет, кредитный отчет и т. д.) (см. рис. 1).
Рис. 1. Записи о коммуникациях между бизнес-персоналом и клиентами
Первый может быть более устным, а второй в основном письменным. Но между ними есть общая черта, то есть они содержат большое количество информации о клиентах. Чтобы извлечь эту информацию, нам нужно использовать технологию (NLP).
Рисунок 2 представляет собой выдержку из отчета о посещении клиента. При рассмотрении его текстовых особенностей было обнаружено, что существует много информации, которая волнует бизнес. Например, с точки зрения профессии клиент является «профессором университета», инвестируемых активов, сумма доверительного управления «1 миллион», тип инвестиции «банковское финансирование», отношение к компании «не понимаю» и т. д.
Рисунок 2 Пример отчета о сопровождении клиентов
Таким образом, мы можем полностью анализировать текст через NLP, выполнять в нем тегирование характеристик клиентов и, наконец, использовать полученные теги для построения портретов клиентов. Это дает много преимуществ, например, облегчает нашим бизнес-персоналу поиск ключевых проблем в любое время и последующие действия, автоматизирует обработку и повышает эффективность работы. После построения портретов этикеток клиентов на основе извлеченной информации вы можете легко подсчитать характеристики спроса в определенном временном диапазоне, предоставить ссылки на коэффициенты для новых настроек продукта или дополнить и проверить содержимое структурированных полей.
Общий путь реализации показан на рисунке 3. Сначала определите библиотеку тегов, которая интересует бизнес, с помощью бизнес-анализа, затем обучите соответствующую модель извлечения для определенных тегов и, наконец, используйте модель для анализа данных для получения ряда. тегов клиентов, которые агрегируются и окончательно формируются в портрет клиента.
Рис. 3 Общий путь реализации
Общий маршрут таков, но у нас также есть некоторые детали, на которые следует обратить внимание в конкретном процессе реализации. Анализируя предыдущие данные, мы обнаружили некоторые характеристики, такие как высокая концентрация информации в тексте, информация обычно выражена в коротких предложениях, но семантика отдельного короткого предложения неоднозначна, и ее необходимо анализировать в комплексе. с определенным контекстом. Следовательно, нам необходимо правильно сегментировать сложные предложения, определить соответствующую степень детализации данных и использовать скользящее окно короткого предложения соответствующего размера для захвата соответствующей контекстуальной семантики.
Кроме того, для внутреннего делового текста содержание включает большое количество названий объектов и терминологии, характерных для продукта, а также большое количество рисунков. В ответ на эту ситуацию мы создали специальный тезаурус и библиотеку сущностей, чтобы точно вырезать и идентифицировать соответствующие имена и термины сущностей. Для обработки чисел мы последовательно сравнили технические решения, такие как вектор слов, замена идентификаторов, распознавание правил + постобработка и т. д., и выбрали метод с лучшим эффектом.
Конечно, мы также сталкиваемся с общей проблемой недостаточного количества размеченных корпусов, поэтому в этом проекте мы сосредоточимся на том, как выполнять малократное обучение в условиях небольших выборок.
На практике при реализации проектов искусственного интеллекта в большинстве профессиональных областей недостаточно размеченных данных, поэтому все более важным становится обучение за несколько выстрелов для обучения на небольших выборках. Маломощное обучение включает в себя множество методов, в том числе общее трансферное обучение + методы тонкой настройки, такие как Берт; есть также некоторые методы, основанные на полуконтролируемом обучении, такие как некоторые модели нейронных сетей, основанные на метриках сходства, и те, которые основаны на алгоритмы ближайшего соседа, методы распространения меток образцов и т. д., есть также связанные методы метаобучения, такие как лучшая статья OpenAI на ICLR 2018, есть даже некоторые связанные методы графовых сетей.
Среди вышеперечисленных методов метод, основанный на трансферном обучении, больше подходит для инженерии и проще в реализации. В нашем проекте мы обнаружили, что трансферное обучение, то есть основанное на модели предварительного обучения, перенесенное на целевую обучающую задачу, в сочетании с помощью маркировки обучения с полуучителем, может лучше удовлетворить наши потребности.
Ниже приводится введение в процесс нашего алгоритма: сначала очистите и вырежьте сложные предложения, затем добавьте некоторые правила фильтрации, чтобы быстро удалить эти очевидные шумовые данные, затем направьте данные в модель извлечения меток, чтобы получить конкретику Наконец, на этапе построения портрета , все полученные метки дедуплицируются и устраняются неоднозначности, чтобы сформировать окончательный портрет клиента.
В зависимости от модели алгоритма мы также сравнили многие методы. По сути, мы считаем, что модель распознавания меток представляет собой алгоритм классификации коротких текстов. Мы пробовали методы, основанные на статистике (SVM, Random Forest, XgBoost), а также пробовали нейронные методы. сетевые модели (FastText, Text CNN/RNN/RCNN, HAN), и, наконец, мы выбрали модель HAN, которая является моделью иерархической сети внимания. Выполняя расчеты RNN и внимания на уровне слов и предложений соответственно, мы finally got Для окончательной классификации используется разумное текстовое векторное представление, и весь процесс показан на рисунке 4.
Рис. 4 Архитектура модели HAN
Общий поток обработки этого примера показан на рисунке 5. После предварительной обработки данных текст параллельно распределяется по каждой модели извлечения меток бизнес-концепции, выводится каждая бизнес-метка и, наконец, суммируется в модуле построения портрета клиента, где выполняется дедупликация, устранение неоднозначностей. и противоречия, и в итоге получить портрет заказчика.
Рис. 5 Общий поток обработки экземпляра
Кроме того, мы разработали соответствующее решение для искусственного интеллекта в реальном времени на основе гибкой платформы данных компании в реальном времени, как показано на рисунке 6. Здесь используются некоторые технологии с открытым исходным кодом нашей команды, в том числе DBus (платформа шины данных), Wormhole. (платформа потоковой обработки), Moonbox (платформа вычислительных услуг) и Davinci (платформа визуальных приложений), эти четыре платформы составляют гибкий стек платформ больших данных.
В этой схеме мы используем DBus для сбора данных на естественном языке в различных хранилищах данных и получения соответствующего текста с помощью некоторых дополнительных технологий (таких как ASR и т. д.), а затем используем Wormhole для выполнения потоковой обработки в реальном времени. потока данных червоточины в реальном времени, автоматически извлекает соответствующие метки из текста в потоке данных, а затем выводит их в назначенное хранилище данных червоточиной; затем Moonbox выполняет последующую суммарную обработку меток, сначала с носителя данных. теги извлекаются, а портретная модель используется для построения портрета, вывода на носитель данных, например Redis, и, наконец, передачи его в бизнес-систему для использования. Это процесс обработки портрета пользователя в реальном времени, который мы внедрили.
Изображение 6
Кроме того, в ветви потока данных в нижней части рисунка 6 мы проводим выборочную выборку через поток производственных данных, циркулирующих на Wormhole, а затем также используем модель этикетки и портретную модель для расчета портрета клиента, а затем используем исходные данные, данные этикетки и портреты клиентов отображаются нашим специалистам по обслуживанию моделей через Davinci для оценки и проверки работы модели, таким образом реализуя систему мониторинга эффекта модели в реальном времени. Объединив их, мы получаем систему построения портретов на основе анализа текста в реальном времени.
Суммировать
Поскольку различные бизнес-структуры уделяют все больше и больше внимания данным на естественном языке, технология NLP + AI стала очень важной и основной базовой технической услугой в различных областях. Сочетание знаний предметной области и технологии NLP принесло новые технические продукты и создало новую ценность для бизнеса, например, некоторые из наших широко используемых в настоящее время продуктов: Siri, Xiao Ai и т. д. Этот разговорный пользовательский интерфейс приносит не только своего рода новый интерактивный режим открыл новое поле продукта.
С точки зрения данных, несмотря на то, что в настоящее время существует большое количество данных на естественном языке, будь то общая область или профессиональная область, по-прежнему не хватает обработанных высококачественных ресурсов данных корпуса естественного языка, поэтому он имеет очень высокое значение. Накопление корпуса доменов может значительно повысить эффективность продуктов ИИ и в определенной степени помочь предприятиям формировать новые барьеры данных и технические барьеры.
С точки зрения алгоритмов НЛП, с точки зрения будущего, как упоминалось выше, обучение в несколько выстрелов для задач с небольшим корпусом будет привлекать все больше и больше внимания, особенно технология трансферного обучения, представленная Бертом, которая даст текущим. Некоторые задачи НЛП принесут революция. Кроме того, существует технология улучшения данных для корпуса НЛП.Мы знаем, что технология улучшения данных в области изображений является относительно зрелой и является распространенным методом обработки данных, но разработка технологии улучшения данных в области НЛП недостаточно развита.Если есть прорыв, я считаю, что это будет большим подспорьем для различных задач НЛП.
Развитие технологии НЛП также требует совместных усилий различных компаний отрасли, специалистов по алгоритмам и инженерии.Я верю, что в будущем мы сможем точнее, быстрее и удобнее понимать данные на естественном языке в различных областях.
Автор: Цзин Юсинь