Классический детальный анализ настроений (ABSA, анализ настроений на основе аспектов) в основном включает в себя три подзадачи, а именно извлечение атрибутов, извлечение точек зрения и три каскадные задачи определения тональности пары атрибут-мнение. В этой статье представлена команда алгоритмов приложения Meituan «складируй, чтобы пообедать», которая сочетает в себе самые передовые методы понимания прочитанного, механизм внимания и другие аспекты извлечения сущностей и опыт анализа настроений для решения четырехкортежного извлечения блюд (блюд, атрибутов, мнения, эмоции) проблемы и применил его в нескольких бизнес-сценариях, надеясь помочь или вдохновить студентов, которые занимаются смежной работой.
1. Предпосылки
Являясь онлайн-платформой электронной коммерции для жизненных услуг, Meituan стремится связать потребителей и продавцов с помощью технологий и стремится обеспечить потребителям качественную жизнь. Как одно из основных направлений деятельности Meituan, кейтеринг в магазине (называемый кейтерингом) является важной платформой для удовлетворения потребностей пользователей в еде и дает возможность продавцам общественного питания работать в Интернете.Он обслуживает миллионы продавцов общественного питания и миллиарды клиентов. - конечные пользователи В процессе было накоплено большое количество информации о комментариях пользователей (User Generated Content, UGC), которая содержит истинные чувства пользователей после их опыта потребления в магазине.Если ключевую эмоциональную полярность и выражение точки зрения можно эффективно извлеченные, они могут не только помочь большему количеству Пользователей принимать решения о потреблении, но и в то же время помочь продавцам собирать информацию отзывов пользователей об условиях ведения бизнеса.
В последние годы технологии НЛП, такие как крупномасштабные модели предварительного обучения (BERT) и быстрое обучение (Prompt), получили быстрое развитие. Эффект применения различных задач обработки естественного языка, таких как классификация текста, маркировка последовательности и генерация текста, был значительно улучшен.Анализ тональности является одной из наиболее распространенных форм приложений. Его задача состоит в том, чтобы анализировать, обрабатывать, индуцировать и рассуждать о входном тексте с помощью технических средств НЛП и давать результат оценки полярности текстового настроения.
В зависимости от степени детализации определения полярности настроений его можно разделить на гранулярный анализ настроений по главам / предложениям, детальный анализ настроений (ABSA, анализ настроений на основе аспектов).[1]. Вообще говоря, цель задачи детального анализа тональности в основном вращается вокруг трех элементов: термин аспекта, термин мнения и полярность тональности, которые можно разделить на извлечение атрибута, извлечение точки зрения и тональность пары атрибут-представление. Склонность определять три каскадные задачи[2-5]. Например, для заданного пользовательского комментария «В этом магазине хорошая обстановка, но обслуживание ужасное» ожидаемым результатом будет (окружение, хорошее, положительное), (обслуживание, плохое, отрицательное).
Сочетая бизнес-сценарии со стороны предложения, со стороны платформы и со стороны спроса в бизнесе по производству еды, команда алгоритмов «от еды к еде» предоставляет эффективные и высококачественные алгоритмические решения для анализа основных бизнес-связей и помогает бизнесу. для снижения затрат и повышения эффективности за счет возможностей алгоритма. В этом документе объединены бизнес-сценарии стороны B/C для изучения практики применения технологии детального анализа тональности в направлении интеллектуального анализа оценок пользователей.
2. Обзор цели
2.1 Деловые вопросы
Придерживаясь миссии «Помогать всем лучше питаться и жить лучше», GoMeal предоставляет потребителям широкий спектр продуктов и услуг, включая пакеты, ваучеры, счета, бронирование и т. д. Списки, такие как список еды, а также поиск, запрос , оценка и т. д. помогают потребителям принимать более обоснованные решения о потреблении. В то же время он предоставляет универсальные маркетинговые услуги для продавцов, чтобы помочь продавцам общественного питания накапливать молву, привлекать пользователей, увеличивать повторные покупки и т. д., а затем легко управлять ресторанами.
С ускорением развития сетей общественного питания и жесткой конкуренцией в отрасли масштабы и сложность управления торговцами постепенно увеличивались, бизнес-требования торговцев становились все более изощренными, а осведомленность об управлении данными становилась все более актуальной. Комментарии к пользовательской истории содержат большое количество отзывов пользователей после употребления, что является важной частью анализа настроений и может не только описывать ощущения от потребления, но и отражать качество обеденной среды. Таким образом, хороший анализ настроений поможет магазинам общепита улучшить качество обслуживания и лучше продвигать потребительский опыт.
Анализ пользовательского контента предназначен главным образом для извлечения соответствующей информации, такой как блюда, услуги и безопасность пищевых продуктов (называемой безопасностью пищевых продуктов), из текстов отзывов, получения детальных эмоций пользователей в различных измерениях и описания статуса обслуживания продавцов в детали, как показано на рисунке 2 выше. Для предприятий общепита проблемы анализа блюд, услуг и оценки безопасности пищевых продуктов можно разобрать следующим образом:
- Оценка блюд, в основном включая идентификацию блюд, извлечение атрибутов оценки, извлечение мнений о блюде, классификацию мнений в комментариях пользователей;
- Оценка услуг, в основном включая извлечение атрибутов оценки из комментариев пользователей, извлечение мнений об услугах и классификацию мнений и настроений;
- Оценка безопасности пищевых продуктов в основном включает в себя извлечение атрибутов оценки из комментариев пользователей, извлечение мнений о безопасности пищевых продуктов и классификацию мнений и настроений.
Среди них вопросы 2 и 3 представляют собой типичные задачи по извлечению троек, т. е. определение аспектов обслуживания или безопасности пищевых продуктов (атрибуты, мнения, настроения). Для вопроса 1, на основе вопросов оценки обслуживания и безопасности пищевых продуктов, оценка блюд должна идентифицировать блюда, упомянутые в обзорах, по сравнению с отраслевой четверкой (атрибут, мнение, категория атрибута, эмоция).[6]Задача извлечения состоит в основном в выявлении четырехкортежности (блюда, атрибуты, мнения, эмоции) в сцене приема пищи.
2.2 Технические исследования
Внутри Meituan мы исследовали соответствующие результаты работы по оценке и анализу пользовательского контента, в основном разработали многозадачную модель, основанную на модели предварительного обучения MT-BERT, пытаясь решить проблему ACSA (анализ оценок по аспектам и категориям) в анализе настроений и ( В то же время китайский набор данных для анализа настроений на уровне атрибутов ASAP, основанный на реальных сценах, является открытым исходным кодом.[7-9]. Однако для бизнеса Meituan по доставке еды нам необходимо предлагать целевые решения, основанные на конкретных сценариях, таких как четырехкратное извлечение задач, и мы не можем напрямую повторно использовать связанные технологии и инструменты от других команд, поэтому необходимо создавать сервисы для обслуживания доставки еды. Методы детального анализа настроений для сцен.
В отрасли мы также изучили соответствующие исследования по детальному анализу настроений, проведенные другими отраслевыми командами, такими как Tencent и Alibaba. В 2019 году Tencent AI Lab и Alibaba Dharma Academy сотрудничали.[3], предложил модель, основанную на двух сложенных LSTM и трех компонентах (ориентация по границам, согласованность настроений и усиление мнений), сочетающих систему аннотаций «BIOES» с положительными, нейтральными, отрицательными настроениями (отрицательными), объединенными для формирования унифицированной метки, которая может идентифицировать как атрибуты, так и эмоции. В том же году Alibaba Dharma Academy предложила структуру модели BERT+E2E-ABSA для дальнейшего решения проблемы совместного извлечения атрибутов и эмоций.[10], представляя (атрибуты, мнения, чувства)[2]Дана задача извлечения триплетов и двухэтапная схема решения: сначала выявляются атрибуты (слияние настроений — это единая метка) и мнения соответственно, а затем оценивается, являются ли атрибуты и мнения парными.
С тех пор последующие исследования в отрасли стали проводить совместную экстракцию троек.[11-14]. Февраль 2021 г., HUAWEI CLOUD[6]Предлагается многозадачная модель четырехкратного извлечения (атрибут, мнение, категория атрибута, настроение), в которой одна задача идентифицирует атрибуты и мнения, а другая — категории атрибутов и настроения. Апрель 2021 г., Тенсент[15]Представляя задачу извлечения триплетов аспект-чувство-мнение (ASOTE), трехэтапная модель BERT с учетом местоположения предлагается для решения проблемы извлечения триплетов (атрибут, мнение, эмоция).
Научно-исследовательские институты | промышленность | предварительно обученная модель | Проблемы мелкозернистого анализа настроений | проблемы с пониманием прочитанного | тройная проблема | четверная задача | совместная проблема извлечения |
---|---|---|---|---|---|---|---|
Дом Али Дхармы[2,10] | электронная коммерция | ✓ | ✓ | ✗ | ✓ | ✗ | ✓ |
ОБЛАКО HUAWEI[6] | облачный сервис | ✓ | ✓ | ✗ | ✗ | ✓ | ✓ |
Тенсент[15] | социальный контакт | ✓ | ✓ | ✗ | ✓ | ✗ | ✗ |
Мейтуан на ужин | местная жизнь | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
С академической точки зрения, больше внимания уделяется тому, как лучше выполнять извлечение сущностей, классификацию настроений и многозадачное совместное извлечение, и может игнорироваться своевременность вычислений, которая больше касается промышленного мира (например, многомерная маркировка и интеграция эмоционального измерения, увеличение вычислительных ресурсов, потребление ресурсов хранения, временная задержка при ограниченных ресурсах), точность эффекта (например, сквозная разработка модулей задач, игнорирование бизнес-персонализации, прямое повторное использование приводит к снижению точности) и другие требования, приводящие к соответствующие технические методы не могут быть непосредственно применены к бизнес-сценариям, для достижения успеха в бизнесе необходимы дальнейшая разработка и совершенствование.
Как показано в таблице выше, для вышеуказанного исследования мы извлекли уроки из опыта поиска Meituan и НЛП в детальном анализе настроений троек, разобрали проблему извлечения четырехкратного приема пищи и объединили с самым продвинутым пониманием прочитанного, вниманием. Основываясь на опыте извлечения сущностей и классификации настроений с точки зрения силового механизма и т. д., он спроектировал и разработал решение для детального анализа настроений, применимое к ресторанному бизнесу.
2.3 Технические цели
Как упоминалось выше, оценка блюд в основном фокусируется на блюдах, атрибутах оценки, мнениях и настроениях блюд, в то время как вопросы оценки обслуживания и безопасности пищевых продуктов в основном сосредоточены на атрибутах оценки услуг или безопасности пищевых продуктов, мнениях и эмоциях. Что касается задачи детального анализа тональности, то видно, что первая проблема связана с четверной информацией, а две последние проблемы связаны только с триплетной информацией.
2.4 Основные проблемы
Поскольку задачу о тройках можно рассматривать как подзадачу задачи о четверках, без ограничения общности, нижеследующее будет сосредоточено на технических проблемах, связанных с задачей о четверках.
Вопрос 3: Как одновременно извлекать и идентифицировать квадруплеты, чтобы уменьшить кумулятивный эффект ошибок в конвейерном методе?
Чтобы уменьшить кумулятивный эффект ошибок в конвейерных методах, типичным решением является предложение одновременной обработки задач извлечения информации и классификации, т.е. многозадачное обучение. Традиционный метод заключается в том, чтобы напрямую попробовать идею многозадачного обучения, но процесс игнорирования зависимостей между сущностями и даже удаленных ассоциаций[2]. В настоящее время мы также пытаемся напрямую преобразовать четверку в многозадачный процесс обучения.В будущем ожидается совместное извлечение и идентификация путем установления парной или тройной связи между сущностями.
Таким образом, дляВопрос 1ивопрос 2, мы будем использовать стратегию для оптимизации результатов извлечения в соответствии с результатами, идентифицированными конвейером; дляВопрос 3, интеграция задач сущностей, отношений и классификации для совместного обучения поможет уменьшить кумулятивный эффект ошибок в конвейерном методе.
3. Практика детального анализа настроений
3.1 Конвейерный метод
Как упоминалось в вопросе 2 раздела 2.3 выше, мы используем конвейерный метод для декомпозиции задачи четверного извлечения на три задачи, которые делятся на распознавание сущностей, извлечение мнений, категорию мнений и классификацию настроений, как показано на рисунке 4 ниже:
3.1.1 Распознавание объектов
БЕРТ с 2018 года[16]После своего появления модель NER была заменена традиционной LSTM+CRF с BERT+CRF (или BERT+LSTM+CRF).Когда-то это была модель SOTA для задач NER в отрасли.В последние два года задачи NER были в основном улучшено по следующим двум аспектам:
- Добавить дополнительные функции[17-19]: такие как признаки слов, признаки слов, признаки частей речи, синтаксические признаки, представления графов знаний;
- Преобразовать форму задачи[20-21]: Преобразование задач NER в задачи ответов на вопросы (QA, ответы на вопросы) или задачи машинного перевода.
Учитывая, что введение дополнительных функций требует построения искусственного словаря, а преобразование заданий на ответы на вопросы опирается на искусственные шаблоны, стоимость высока, поэтому принята модель BERT+CRF.
Настройка скорости обучения, настройка политики модели. В ходе эксперимента мы обнаружили, что BERT+CRF имеет небольшое улучшение по сравнению с простым BERT+Softmax, Причина в том, что предобучающая модель может изучать признаки с явной дискриминацией после тонкой настройки, что приводит к увеличению слоя CRF для сущности. признание Результаты малоэффективны. Тем не менее, хорошая матрица перехода CRF, очевидно, полезна для предсказания, что может добавить ограничения к последним предсказанным меткам, чтобы обеспечить разумность результатов предсказания. После дальнейших экспериментов было обнаружено, что путем регулировки скорости обучения слоев BERT и CRF, таких как BERT, использующий меньшую скорость обучения, и уровень CRF, использующий скорость обучения, в 100 раз превышающую скорость обучения BERT (т.е., как показано на рис. 5), конечный эффект BERT+CRF значительно улучшается по сравнению с BERT+Softmax. Кроме того, на основе традиционной модели NER LSTM+CRF мы также экспериментировали с BERT+LSTM+CRF, но эффект на самом деле немного уменьшился, а также увеличилось время прогнозирования, поэтому слой LSTM в итоге не был введен.
3.1.2 Извлечение мнений
Задача извлечения мнений, также известная в отрасли как целевое извлечение слов мнений (TOWE), направлена на извлечение слов мнений, соответствующих заданной цели, из предложений комментариев. Извлечение мнений также можно рассматривать как задачу NER, но как точно извлечь все отношения «сущность-мнение» является технической проблемой, если обзор включает несколько сущностей и мнений. Опираясь на идею задачи MRC (понимание машинного чтения), он вводит предварительные знания, создавая разумный запрос, чтобы помочь извлечь точку зрения.
Форма задачи QA, моделирование извлечения точки зрения. Как показано на рисунке 6, модель в целом состоит из слоя предварительной подготовки и выходного слоя. Для выходного слоя мы используем обычные выходные данные задачи контроля качества, включая начальную метку и конечную метку, но нам нужно вручную спроектировать очередь. Справочные документы[20]На примере рисунка 3 эксперимент показал, что запрос, разработанный для «выяснения вкуса, текстуры, количества, ингредиентов, внешнего вида, цены, гигиены и общей оценки свежих клецок с креветками», работает лучше всего и может включать информацию описания точки зрения. , который более эффективен. Помогает в извлечении мнений. Учитывая, что задача QA, естественно, имеет проблему дисбаланса классов, функция потерь вводит Focal Loss для дисбаланса классов, чтобы улучшить эффект модели извлечения точки зрения. Поскольку извлечение мнений также можно рассматривать как задачу NER, мы пытаемся спроектировать выходной слой как слой CRF, но экспериментальный эффект не идеален, что может повлиять на распознавание модели из-за разной длины и персонализации предложений мнения. С другой стороны, учитывая, что китайская модель предварительного обучения Google BERT разделена по степени детализации слов и не учитывает сегментацию китайских слов в традиционном НЛП, на уровне предварительного обучения мы заменяем модель BERT открытой моделью. исходная китайская модель предварительной подготовки Харбинского технологического института, такая как BERT -wwm-ext, RoBERTa-wwm и т. д., окончательный эффект модели был дополнительно улучшен.
3.1.3 Категория мнений и классификация настроений
Категория мнения и классификация настроения могут рассматриваться как две задачи классификации, в которых категория мнения четверной задачи оценки блюда включает восемь меток, таких как вкус, вкус, вес, ингредиенты, внешний вид, цена, гигиена и блюда в целом, а настроение включает положительный Четыре ярлыка: положительный, нейтральный, отрицательный и неупомянутый — все предопределены бизнесом. Учитывая, что мнения об определенном блюде, упомянутые в комментариях пользователей, могут включать в себя несколько измерений, если каждое измерение моделируется отдельно, необходимо построить несколько моделей, что сложно и трудно поддерживать. Объединить ATAE-LSTM[22]и Центр НЛП[7-9]Основываясь на опыте анализа настроений и характеристиках общественного питания, общая структура модели разработана как многозадачная мультиклассификационная структура обучения.
Многозадачная мультиклассификационная модель для совместного моделирования категорий мнений и настроений. Как показано на рисунке 7, модель в целом разделена на две части, а именно: общий уровень BERT и исключительный уровень Attention, где общий уровень BERT изучает встраивание точки зрения, а исключительный уровень Attention изучает сентиментальную тенденцию точки зрения. в каждой категории точек зрения. Учитывая, что каждая часть комментария будет посвящена разным измерениям точки зрения, введение структуры «Внимание» заставляет модель уделять больше внимания текстовой информации, относящейся к определенному измерению, тем самым улучшая общий эффект.
3.2 Федеративное обучение
Преимущество конвейерного метода состоит в том, что целевая задача разбивается на несколько подмодульных задач, и подмодули соответственно оптимизируются, а проблема отношения «многие ко многим» между сущностями может быть решена в определенной степени посредством поста. -обработка. Однако конвейерный метод также имеет некоторые фатальные недостатки, в основном в том числе:
- Распространение ошибок, ошибка модуля распознавания сущностей повлияет на производительность модели извлечения мнений;
- Игнорируется корреляция между задачами, например, сущности и точки зрения часто появляются вместе, если можно знать точку зрения, то можно судить и об описываемой сущности, а конвейерный метод, очевидно, не может использовать эту информацию;
- Из-за избыточности информации необходимо извлечь идентифицированные сущности и классифицировать извлеченные мнения, что приводит к некоторым недействительным совпадающим парам и увеличивает частоту ошибок.
Что касается текущей ситуации совместного обучения анализу настроений в отрасли, то это в основном совместное извлечение троек (атрибут, мнение, настроение). В сочетании с характеристиками бизнес-сценария ресторанного бизнеса (как описано в вопросе 2 задачи 2.3) общий план представляет собой двухэтапную модель: первый этап — совместное обучение объектов блюда, взглядов и эмоций, а второй этап — классифицировать представления, а затем получить четыре этапа.Результат распознавания кортежей.
3.2.1 Совместное извлечение троек
В настоящее время в научных кругах методы совместного извлечения троек (атрибутов, мнений, настроений) в основном включают методы маркировки последовательностей.[11], метод обеспечения качества[5,12], генеративный метод[13,14]Ждать. Объединив опыт сцены анализа тарелок и модуль извлечения точек обзора в конвейерном методе, мы приняли метод совместного извлечения в стиле QA, в основном ссылаясь на модель Dual-MRC.[5].
Улучшение модели Dual-MRC, моделирование извлечения тройного соединения. В процессе проектирования модели, поскольку тенденция настроения классификации двойной модели MRC представляет собой общую оценку определенного атрибута, то есть атрибут соответствует только одной эмоции. Однако в сценарии подачи еды добавлено распознавание сущностей блюд, и в комментариях пользовательского контента к одному и тому же блюду появляются разные мнения и эмоциональные тенденции. Как показано на рис. 3, фраза «очень вкусно» выражает положительное отношение к «креветочным клецкам», а фраза «немного дороже» явно выражает отрицательное отношение. Поэтому мы перерабатываем модель Dual-MRC, чтобы интегрировать ярлыки мнений и настроений в единый ярлык. Как показано на рисунке 8, общая структура Dual-MRC для еды основана на модели BERT с двумя башнями.При введении двух запросов левая сторона отвечает за извлечение объектов блюда, а правая — за извлечение взгляды и чувства, тем самым реализуя тройное совместное извлечение.
Описание структуры модели:
- Целое состоит из двух частей: левый BERT извлекает сущности блюда, правый BERT извлекает мнения и настроения и формирует унифицированные метки B-{POS, NEU, NEG}, I-{POS, NEU, NEG} и O , где в O-метку не интегрировано упоминание о чувствах;
- Ссылаясь на опыт конвейерного метода, построим две Очереди, левая Очередь1 строится как «узнай блюда в комментариях», а правая Очередь2 строится как «узнай вкус, консистенцию, количество, ингредиенты, внешний вид, цена, гигиена и общая оценка»;
- На этапе обучения для каждого объекта тарелки, отмеченного слева, необходимо повторить процесс справа, и модели с обеих сторон используют общие параметры для обучения; на этапе прогнозирования, поскольку объект неизвестен, применяется конвейерный метод. Сначала из левой части извлекаются все сущности блюда, а затем для каждой сущности вводится правая часть, и извлекаются мнение и настроение мнения.
На этой основе мы также исследовали возможность четырехкратного совместного извлечения. Конкретная операция заключается в преобразовании правильного запроса 2, например, «найти оценку вкуса пельменей с начинкой из креветок». Для каждой категории мнений нам необходимо построить запрос для прогнозирования Таким образом реализуется четверное суставное извлечение. Однако, учитывая масштабность и трудоемкость расчета, категория мнений в конечном итоге прогнозируется отдельно.
3.2.2 Классификация категорий мнений
Классификационное представление, очевидно, представляет собой проблему классификации текста, классификация BERT, основанная на общепринятой практике, принимая позицию Embedding [CLS], затем полный уровень подключения к слою и Softmax. В сценарии пищевого бизнеса основная проблема, с которой сталкиваются небольшие выборки, эталонные образцы нескольких решений NLP в отрасли, основанные на сравнительном исследовании R-drop.[23]Методы и подсказки[24]Представлена четвертая нормальная форма. Основываясь на структуре модели BERT, мы экспериментировали с методом шаблона Prompt (показан на рисунке 9) и увеличением данных R-drop (показан на рисунке 10). Среди них шаблон Prompt в основном основан на P-настройке.[25]На основе идеи автоматизации построения шаблонов задача решается на основе задач МЛМ.
На рис. 9 [u1]~[u6] представляют [unused1]~[unused6] в словаре BERT, то есть шаблон строится с использованием несуществующего токена, а количество токенов является гиперпараметром. Экспериментальные результаты показывают, что модель предварительного обучения, основанная на BERT, в сочетании со структурой P-настройки или R-drop может в определенной степени улучшить эффект классификации, а эффект P-настройки немного лучше, чем эффект R -drop, и последующая деятельность будет продолжать исследовать меньшее количество образцов решения.
В-четвертых, применение в пищевой промышленности
4.1 Сравнение эффекта модели
Используя данные аннотации UGC еды, был оценен общий эффект распознавания четверки, и значение F1 было окончательно рассчитано по степени точности и скорости отзыва всей четверки в качестве индекса оценки производительности. Как показано на рисунке 11, при использовании классической модели BERT + CRF для извлечения объектов значение F1 данных аннотаций комментариев к еде достигает только 0,61.После оптимизации базовой настройки, такой как скорость обучения, значение F1 увеличивается на 2,61%. . Как упоминалось выше, в модуле извлечения мнений после преобразования вопроса о маркировке последовательности в вопрос-ответ (QA) с использованием модели BERT + MRC F1 значительно улучшился до 0,64, увеличение на 5,9%, что указывает на что преобразование вопроса принесло больше пользы. Кроме того, использование китайского предварительного обучения BERT Харбинского технологического института все же достигло определенной степени улучшения, и F1 увеличился до 0,65. Обратите внимание, что итерация модели на рисунке 11 представляет собой модель ключевого модуля оптимизации в задаче четверки, и общий эффект четверки наконец оценивается для сравнительного анализа.
4.2 Сценарии бизнес-приложений
Панель управления брендом
Являясь важной частью возможностей флагманского магазина, панель управления брендом предоставляет сервисы данных на уровне бренда, помогающие бизнесу расти. Продукт позиционируется как центр обработки данных ведущего бренда общественного питания с базовыми возможностями раскрытия данных и направляет бизнес-решения путем количественной оценки бизнес-эффектов. Поскольку Dike накопил огромное количество онлайн-информации на платформе (большой объем данных о транзакциях/трафике/комментариях), существует большое пространство для добычи и анализа. Применяйте технологию детального анализа настроений, чтобы извлекать из данных комментариев соответствующую информацию о параметрах блюд, услуг и безопасности пищевых продуктов, количественно оценивать эффективность бизнеса продавцов и направлять деловые действия. Что касается мониторинга отзывов пользователей о блюдах, бренд-продавцы уделяют больше внимания отзывам пользователей в таких аспектах, как блюда, вкус и вкус. После итерации модели, как описано выше, точность распознавания эмоции блюда, вкусовой эмоции и вкусовой эмоции была в определенной степени улучшена.
Оптимизация информации о блюдах продавцов ресторана
С прибытием еды было усилено построение информации о блюдах, в основном, в том числе на уровне производства, интеграции данных о блюдах из различных источников продавцов, построении центра блюд для продавцов и оптимизации функции загрузки пользовательского контента C- гарниры, эффективно дополняющие производство блюд UGC; на уровне потребления На платформе он объединяет блюда, предлагаемые продавцами, и блюда, рекомендованные пользователями сети, и на основе улучшения информации о еде, агрегации контента и отображения потребления C информация о пищевых продуктах оптимизирована. В то же время, в сотрудничестве с предприятиями общественного питания, мы будем продолжать расширять возможности пользователей за счет производства и построения оценочной информации, а также помогать пользователям описывать и представлять торговые блюда на уровне оценки и производства. В основном с целью оценки информации, касающейся блюд продавцов ресторана, выполняется увязка информации и оптимизация уровня отображения.По сравнению с предыдущей итерацией степень охвата оцениваемых блюд была значительно улучшена.
Управление оценкой Kaidianbao
Продавцы привлекают пользователей, предоставляя услуги общественного питания, а пользователи оставляют отзывы продавцам посредством оценки после потребления, побуждая продавцов постоянно оптимизировать и предоставлять более качественные услуги, тем самым привлекая больше пользователей и достигая положительного цикла. Значение анализа оценки состоит в том, чтобы установить канал между оценкой и службой общественного питания, а также реализовать положительный цикл продвижения оценки к обслуживанию. Анализируя содержание оценки, он может помочь продавцам выяснить, что ресторан делает хорошо, а что плохо с точки зрения блюд, услуг, окружающей среды и т. д., а затем внести целевые улучшения. По сравнению с предыдущей итерацией количество связанных комментариев в измерениях блюд, услуг и окружающей среды было значительно улучшено.
V. Перспективы будущего
После почти года разработки возможности, связанные с анализом настроений, были не только успешно применены к операциям ресторанного бизнеса, цепочке поставок и другим предприятиям, но также оптимизировали информацию о блюдах из нескольких источников, помогая продавцам брендов отслеживать отзывы пользователей и улучшать возможности обслуживания продавцов. . В исследовании совместного обучения четверная задача в основном преобразуется в двухэтапную модель.Как показано на рисунке 11, значение F1 упало до 0,63. Причина может заключаться в том, что в модели извлечения тройного соединения игнорируются отношения между объектами, особенно долгосрочные отношения (как описано в вопросе 3 2.4 выше), в результате чего производительность оказывается ниже ожидаемой. Далее мы еще больше улучшим возможность четырехкратного извлечения при анализе тональности и извлечем основные потребности и важные отзывы пользователей в пользовательском контенте. С точки зрения технологии, итеративная эволюция модели будет продолжаться, в основном, включая:
-
Непрерывная оптимизация существующих моделей для обеспечения качества при одновременном повышении эффективности
Есть еще много возможностей для улучшения экспериментальных результатов, и необходимо дальнейшее изучение методов оптимизации модели, таких как оптимизация модели предварительного обучения, использование MT-BERT и т. д., а также дальнейшее введение взаимосвязей между объектами в совместная экстракция для повышения производительности четверной экстракции.
-
Глубоко изучите область анализа настроений и создайте четырехкомпонентную модель совместного извлечения.
Четырехкратное извлечение в основном достигается путем преобразования запроса, но уровень вычислений велик, и необходимо изучить оптимизацию структуры модели, уменьшить количество избыточных вычислений и сделать так, чтобы они соответствовали четверному совместному извлечению.
-
Построение общей основы для детального анализа настроений
Сцена прибытия еды включает в себя несколько сценариев анализа настроений, и необходимо создать гибкую и удобную общую структуру, которая поможет быстро поддержать бизнес и сократить потребление ресурсов.
В будущем команда продолжит оптимизировать прикладную технологию для удовлетворения потребностей в эмоциональном анализе в бизнес-сценарии общественного питания. Детальный анализ настроений — сложная и многообещающая задача, и команда алгоритмов общественного питания в магазине будет продолжать исследовать и исследовать вместе с читателями.
6. Ссылки
- [1] Лю Б. Анализ настроений и анализ мнений, 2012. Обобщающие лекции по технологиям человеческого языка 5(1):1–167.
- [2] Пэн, Х. Сюй, Л. Бинг, Л. Хуанг, Ф. Лу, В. и Си, Л. 2020. Знание того, что, как и почему: почти полное решение для анализа настроений на основе аспектов, В AAAI , 8600–8607.
- [3] Ли, X. Бинг, Л. Ли, П. и Лам, В. 2019a Унифицированная модель для извлечения целевых мнений и прогнозирования целевых настроений, В AAAI, 6714–6721.
- [4] Чжао, Х. Хуанг, Л. Чжан, Р. Лу, К. и Сюэ, Х. 2020. SpanMlt: многозадачная обучающая структура на основе Span для парного извлечения терминов аспектов и мнений, В ACL, 3239–3248.
- [5] Y. Mao, Y. Shen, C. Yu, and L. Cai. 2021. A joint training dual-mrc framework for aspect based sentiment analysis. arXiv preprint arXiv:2101.00816.
- [6] HUAWEI CLOUD Детальный анализ тональности текста и его применение
- [7] Ян Ян, Цзя Хао и др. Исследование и практика Meituan BERT.
- [8] Жэнь Лэй, Бу Цзяхао и др. Исследование и применение технологии анализа настроений в Meituan.
- [9] Bu J, Ren L, Zheng S, et al. ASAP: A Chinese Review Dataset Towards Aspect Category Sentiment Analysis and Rating Prediction. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. 2021.
- [10] Xin Li, Lidong Bing, Wenxuan Zhang, and Wai Lam. Exploiting BERT for end-to-end aspect-based sentiment analysis. In W-NUT@EMNLP, 2019.
- [11] Сюй, Л. Ли, Х. Лу, В. и Бинг, Л. 2020. Маркировка с учетом положения для извлечения триплетов тональности аспекта, В EMNLP, 2339–2349.
- [12] Chen, S. Wang, Y. Liu, J. and Wang, Y. 2021a. Bidirectional Machine Reading Comprehension for Aspect Sentiment Triplet Extraction. In AAAI.
- [13] Yan, H. Dai, J. Qiu, X. Zhang, Z. et al. 2021. A Unified Generative Framework for Aspect-Based Sentiment Analysis. arXiv preprint arXiv:2106.04300.
- [14] Вэнь Суан Чжан, ξ NL i, Ян Дэн, Ли Донг Бин и Вэйл А. М. 2021. Анализ настроений в отношении генеративной аспектной базы, I NaCl/I JC NLP 2021, 504–510.
- [15] Li Yuncong, Fang Wang, Zhang Wenjun, Sheng-hua Zhong, Cunxiang Yin, & Yancheng He. 2021. A More Fine-Grained Aspect-Sentiment-Opinion Triplet Extraction Task. arXiv: Computation and Language.
- [16] Девлин, Дж. Чанг, М.-В. Ли, К. и Тутанова, К. 2019. BERT: предварительная подготовка глубоких двунаправленных преобразователей для понимания языка, В NAACL-HLT, 4171–4186.
- [17] Yue Zhang and Jie Yang. 2018. Chinese ner using lattice lstm. arXiv preprint arXiv:1805.02023.
- [18] Li, X. Yan, H. Qiu, X. and Huang, X. 2020. FLAT: Chinese NER Using Flat-Lattice Transformer. arXiv preprint arXiv:2004.11795 .
- [19] Тарек Аль-Мослми, Марк Галлофре Окана, Андреас Л. Опдаль и Чаба Верес, 2020. Извлечение именованных объектов для графов знаний: обзор литературы, IEEE Access 8 (2020), 32862–32881.
- [20] X. Li, J. Feng, Y. Meng, Q. Han, F. Wu, and J. Li, 2020. Унифицированная структура MRC для распознавания именованных объектов, In ACL, 5849–5859.
- [21] Яна Стракова, Милан Страка и Ян Хаджич, 2019. Нейронные архитектуры для вложенных нейронов посредством линеаризации, В материалах 57-го ежегодного собрания Ассоциации вычислительной лингвистики, 5326–5331.
- [22] Ецюань Ван, Минли Хуанг, Ли Чжао и Сяоянь Чжу, 2016 г. LSTM на основе внимания для классификации настроений на уровне аспектов, Материалы конференции по эмпирическим методам обработки естественного языка, 606–615.
- [23] Liang X, Wu L, Li J, et al. R-Drop: Regularized Dropout for Neural Networks[J]. arXiv preprint arXiv:2106.14448, 2021.
- [24] P. Liu, W. Yuan, J. Fu, Z. Jiang, H. Hayashi, and G. Neubig. 2021. Pre-train, prompt, and predict: A systematic survey of prompting methods in natural language processing. arXiv preprint arXiv:2107.13586.
- [25] X. Liu, Y. Zheng, Z. Du, M. Ding, Y. Qian, Z. Yang, and J. Tang. 2021. Gpt understands, too. arXiv preprint arXiv:2103.10385.
7. Объяснение терминологии
срок | объяснять |
---|---|
ABSA | Детальный анализ настроений, анализ настроений на основе аспектов |
NER | Распознавание именованных объектов |
TOWE | Целенаправленное извлечение мнений |
MRC | Понимание прочитанного, понимание машинного чтения |
MLM | Модель языковой маски, Маскированная языковая модель |
BERT | Представления двунаправленного энкодера от трансформаторов |
CRF | Условные случайные поля |
LSTM | Долгая кратковременная память |
R-drop | Стратегия регуляризации после отсева |
8. Введение автора
Чу Чжэ, Ван Лу, Рунью, Ма Нин, Цзяньлинь, Чжан Кун и Лю Цян — все из бизнес-группы Meituan Daodian/отдела платформенных технологий.
9. Информация о наборе
Направление Cuisine Knowledge Graph отдела стратегии обработки бизнес-данных Meituan, входящего в состав группы по стратегии бизнес-данных, в основном отвечает за применение знаний о рецептах в компаниях, связанных с прибытиями, а также за предоставление эффективных, высококачественных и интеллектуальных алгоритмов приложений для служб прибытия. Основываясь на массивных данных о бизнесе общественного питания, он применяет передовые методы извлечения сущностей, анализа отношений, изучения представлений сущностей, детального анализа настроений, обучения на малых выборках, частично контролируемого обучения и других алгоритмических технологий для обеспечения алгоритмической поддержки предприятий общественного питания.
Группа стратегии бизнес-данных имеет долгосрочный набор экспертов по алгоритмам обработки естественного языка / экспертов по алгоритмам машинного обучения в направлении карты знаний блюд Заинтересованные студенты могут отправить свои резюме наhejianlin@meituan.com.
Прочтите другие подборки технических статей от технической команды Meituan
внешний интерфейс | алгоритм | задняя часть | данные | Безопасность | Эксплуатация и техническое обслуживание | iOS | Android | контрольная работа
|Ответьте на ключевые слова, такие как [акции 2020 г.], [акции 2019 г.], [акции 2018 г.], [акции 2017 г.] в диалоговом окне строки меню общедоступной учетной записи, и вы сможете просмотреть коллекцию технических статей технической группы Meituan в течение годы.
| Эта статья подготовлена технической командой Meituan, авторские права принадлежат Meituan. Добро пожаловать на перепечатку или использование содержимого этой статьи в некоммерческих целях, таких как обмен и общение, пожалуйста, укажите «Содержимое воспроизводится технической командой Meituan». Эта статья не может быть воспроизведена или использована в коммерческих целях без разрешения. Для любой коммерческой деятельности, пожалуйста, отправьте электронное письмо по адресуtech@meituan.comПодать заявку на авторизацию.