Как развивающийся бизнес со взрывным ростом, уничтожение сценариев имеет недостатки в размещении заказов у продавцов, покупках пользователей и согласовании спроса и предложения Стандартизация поставок может создавать ценность для пользователей, продавцов и платформ и способствовать развитию бизнеса. В этой статье представлена схема процесса и алгоритма группы интегрированных бизнес-данных Meituan-to-Store для быстрого создания стандартизации поставок с нуля до 1. Мы охватываем всестороннюю карту знаний Meituan Daodian (GENE, GENeral NEeds net) для индустрии уничтожения сценариев, создаем карту знаний по уничтожению сценариев и реализуем построение стандартизации предложения, включая добычу ресурсов уничтожения сценариев, создание стандартной библиотеки сценариев, поставку и стандартная корреляция сценариев и т. д. Мы надеемся принести вам некоторую помощь или вдохновение.
1. Предпосылки
Индустрия уничтожения скриптов в последние годы продемонстрировала тенденцию к взрывному росту.Однако, поскольку уничтожение скриптов является развивающейся отраслью, существующая система категорий и форма продукта на платформе все труднее удовлетворяют быстрорастущие потребности пользователей и продавцов. главным образом в следующих трех аспектах:
- Категория платформы отсутствует: на платформе отсутствует специальная категория «уничтожение сценариев», а отсутствие централизованных порталов трафика приводит к путанице в путях принятия решений пользователями, и трудно установить единое восприятие пользователей.
- Принятие решений пользователями неэффективно: Ядром уничтожения скриптов является скрипт.Из-за отсутствия стандартной библиотеки скриптов и отсутствия взаимосвязи между стандартным скриптом и поставками стандартизация отображения информации о скрипте и управления поставками низка, что влияет на эффективность работы пользователей. принятие решения о выборе сценария.
- Список товаров громоздкий: продавцы должны вручную вводить информацию о товарах один за другим, и нет стандартного шаблона для предварительного заполнения информации, что приводит к низкой доле скриптов, перечисленных продавцами на платформе, и есть большие возможности для повышения эффективности. листинга.
Чтобы решить вышеуказанные болевые точки, бизнесу необходимо стандартизировать предложение уничтожения скриптов: во-первых, создать новую категорию «убийство скриптов» и завершить миграцию категории соответствующего предложения (включая продавцов, товары и контент). . На основе этого, со сценарием в качестве ядра, создается стандартная библиотека сценариев, и сценарий связывается с поставкой, а затем устанавливаются канал распространения информации, оценка и система списков измерения сценария для удовлетворения решения пользователя. -создание пути "поиск магазина со скриптом".
Стоит отметить, что стандартизация поставок является важной отправной точкой для упрощения познания пользователей, помощи пользователям в принятии решений и содействия согласованию спроса и предложения.Уровень стандартизации оказывает решающее влияние на масштаб бизнеса платформы. Применительно к индустрии уничтожения сценариев построение стандартизации поставок является важной основой для постоянного роста бизнеса уничтожения сценариев, а создание стандартной библиотеки сценариев является ключом к стандартизации снабжения уничтожением сценариев. Поскольку конкретный сценарий не может быть определен на основе атрибутов сценария, таких как характеристики, такие как «граница города», фон, такой как «древний стиль», и тема, такая как «эмоции», но имя сценария, такое как «шели», может воспроизводиться роль уникальной идентификации. Таким образом, создание стандартной библиотеки сценариев — это, прежде всего, создание имен стандартных сценариев, за которыми следует создание стандартных атрибутов сценариев, таких как спецификации, предыстория, тема, сложность, жанр и т. д.
Подводя итог, можно сказать, что группа интегрированных бизнес-данных Meituan-to-Store работает с бизнесом, чтобы помочь бизнесу стандартизировать поставки уничтожения сценариев. В процессе построения участвуют различные типы сущностей, такие как имена сценариев, атрибуты сценариев, категории, продавцы, товары и контент, а также построение разнообразных отношений между ними. Как семантическая сеть, которая выявляет сущности и отношения между сущностями, граф знаний особенно подходит для решения этой проблемы. В частности, мы построилиMeituan в магазин комплексной карты знаний (GENE, GENeral NEeds net)Поэтому, основываясь на опыте построения GENE, мы быстро строим карту знаний нового бизнеса по уничтожению сценариев и реализуем стандартизацию построения уничтожения сценариев от 0 до 1, тем самым улучшая управление поставками и соответствие спроса и предложения, а также создавая лучшая среда для пользователей, продавцов и платформ.
2. Решения
GENE, который мы построили, основан на комплексных потребностях местных живых пользователей, с пятью уровнями отраслевой системы, объектом спроса, конкретным спросом, элементом сцены и спросом сцены, охватывающими игру, медицинскую красоту, образование, родитель-ребенок, брак и т. д. Несколько услуг, дизайн системы и технические детали видныMeituan в магазин всеобъемлющей карты знанийСтатьи по Теме. Как развивающийся комплексный бизнес Meituan-to-store, уничтожение скриптов отражает новые потребности пользователей с точки зрения игры и естественным образом адаптируется к архитектуре GENE. Поэтому мы используем GENE для создания сценариев, убивающих новый бизнес, и следуем той же идее, чтобы построить соответствующую карту знаний для достижения соответствующей стандартизации поставок.
Ключом к реализации стандартизированной конструкции уничтожения сценариев на основе графа знаний является построение графа знаний уничтожения сценариев со стандартным сценарием в качестве ядра. Схема системы карт показана на рисунке 1. В частности, построение новой категории убийства по сценарию сначала выполняется на системном уровне отрасли, добывается предложение убийства по сценарию, а принадлежность между предложением (включая торговцев) , товары и содержание) и устанавливается категория. На этой основе на уровне объекта спроса дополнительно реализуйте добычу и построение взаимосвязей узла основного объекта имени стандартного сценария и его узла атрибута сценария, создайте стандартную библиотеку сценариев и, наконец, свяжите каждый стандартный сценарий в стандартной библиотеке сценариев. с поставкой и пользователями.Выстраивайте отношения. Кроме того, три слоя фигуративных требований, элементов сцены и требований сцены реализуют явное выражение требований пользователей к образным услугам и требований, основанных на сценариях, в убийстве сценария.Отчасти это связано с тем, что нет большой связи со стандартизацией конструкции сценария. Убийственное снабжение Здесь не делается введения.
Конкретный пример, используемый для предоставления стандартизированной части графа знаний об уничтожении сценариев, показан на рисунке 2 ниже. Среди них стандартное имя сценария является основным узлом, а различные стандартные узлы атрибутов сценария вокруг него включают тему, спецификацию, жанр, сложность, предысторию, псевдоним и т. д. В то же время между стандартными сценариями, такими как «Вырезать» и «Вырезать 2», могут быть построены такие типы отношений, как «одинаковая серия». Кроме того, стандартный скрипт также устанавливает ассоциации с товарами, продавцами, контентом и пользователями.
Мы стандартизируем предложение на основе этих узлов и отношений графа знаний об убийстве сценария.В процессе построения графа, в том числеScript Killing Supply Mining,Стандартная сборка библиотеки скриптов,Поставка связана со стандартным скриптомТри основных шага, детали реализации трех шагов и задействованные алгоритмы представлены ниже.
3. Метод реализации
3.1 Скрипт, уничтожающий добычу полезных ископаемых
Как развивающийся бизнес, убийство по сценарию не имеет соответствующей категории в существующем дереве отраслевых категорий, и невозможно напрямую получить соответствующие ресурсы (включая торговцев, товары и контент) убийства по сценарию в соответствии с категорией. Следовательно, нам нужно сначала добыть предложение убийств по сценарию, то есть выкопать соответствующее предложение убийств по сценариям из текущего предложения аналогичных категорий в индустрии убийства по сценарию.
Для анализа предложения продавца по уничтожению скриптов необходимо оценить, предоставляет ли продавец услуги по уничтожению скриптов.Суждение основано на текстовом корпусе из трех источников: имя продавца, название продукта и сведения о продукте, а также продавец. Пользовательский контент. По сути, это проблема классификации данных из нескольких источников.Однако из-за отсутствия помеченных обучающих выборок мы не применяли модель сквозной классификации данных из нескольких источников напрямую, а полагались на бизнес-вход, используя комбинацию неконтролируемое сопоставление и контролируемая подгонка Метод эффективно реализован, и конкретный процесс различения показан на рисунке 3 ниже, в котором:
- Неконтролируемое сопоставление: Во-первых, создайте тезаурус ключевых слов, связанный с уничтожением скриптов, и выполните точное сопоставление в текстовом корпусе трех источников имени продавца, товарного наименования и информации о товаре, а также пользовательского контента продавца, а затем создайте текстовый корпус на основе BERT.[1]Общая дискриминантная модель семантического дрейфа используется для фильтрации результатов сопоставления. Наконец, соответствующий показатель соответствия рассчитывается на основе результатов сопоставления каждого источника в соответствии с бизнес-правилами.
- примерка под наблюдением: чтобы количественно оценить влияние сопоставления оценок из разных источников на окончательные результаты распознавания, операторы вручную отмечают небольшое количество оценок продавцов, чтобы охарактеризовать силу продавцов, предоставляющих услуги по уничтожению скриптов. На этой основе мы построили модель линейной регрессии, чтобы соответствовать отмеченным оценкам продавцов и получить вес каждого источника, чтобы добиться точного анализа продавцов, убивающих сценарии.
Применяя вышеуказанный метод, реализуются раскопки настольных и реальных торговцев сценарием, убивающих торговцев, а скорость точности и скорость отзыва соответствуют требованиям. Основываясь на результатах майнинга торговцев, убивающих скрипты, можно дополнительно добывать продукты и создавать категории уничтожения скриптов, тем самым закладывая основу данных для последующего построения карты знаний об уничтожении скриптов и построения стандартизации.
3.2 Конструкция стандартной библиотеки сценариев
Являясь ядром всего графа знаний об уничтожении сценариев, стандартный сценарий играет важную роль в построении стандартизации предложения уничтожения сценариев. Основываясь на аналогичной совокупности скриптов и товаров, мы сочетаем ручную проверку со стандартными скриптами и получаем авторизацию скриптов от соответствующих эмитентов для создания стандартной библиотеки скриптов. Стандартный скрипт состоит из двух частей, одна из которых представляет собой имя стандартного скрипта, а другая — атрибут стандартного скрипта. Поэтому построение стандартной библиотеки сценариев также делится на две части: анализ имен стандартных сценариев и анализ атрибутов стандартных сценариев.
3.2.1 Добыча стандартных имен скриптов
В соответствии с характеристиками продуктов для уничтожения скриптов мы последовательно использовали три метода агрегации правил, семантическое агрегирование и мультимодальное агрегирование для извлечения и итерации, а также агрегировали тысячи стандартных имен сценариев из названий сотен тысяч продуктов для уничтожения скриптов. Три метода агрегирования описаны ниже.
агрегация правил
Названия одних и тех же продуктов для уничтожения скриптов у разных продавцов часто разные, много несоответствий и персонализации. С одной стороны, одно и то же название скрипта может иметь несколько названий, например «шели», «шели один», «шели 1» — это один и тот же скрипт; кроме того, продавцы часто добавляют атрибутивную информацию, такую как спецификации и темы сценарий, а также привлекающие пользователей описательные тексты, такие как «Эмоциональная книга «Ше Ли». Поэтому сначала мы рассматриваем характеристики наименований товаров, убивающих сценарии, и разрабатываем соответствующую стратегию очистки, чтобы очистить имена товаров, убивающих сценарии, а затем объединить их.
В дополнение к сортировке общих слов, не являющихся сценарием, и построению тезауруса для фильтрации правил, мы также пытаемся преобразовать их в задачи распознавания именованных сущностей.[2], используя аннотацию последовательности, чтобы различать две категории символов: «является именем сценария» и «не является именем сценария». Для очищенного имени продукта, убивающего скрипты, оно агрегируется с помощью правила расчета сходства на основе самой длинной общей подпоследовательности (LCS) в сочетании с пороговой фильтрацией, такой как «Шели», «Шели 1», «Шели 1» «В конце концов они все собрались. Весь процесс показан выше на Рисунке 4. Метод агрегирования правил может помочь бизнесу быстро агрегировать имена продуктов уничтожения скриптов на ранней стадии создания.
Семантическая агрегация
Хотя метод агрегации правил прост и удобен в использовании, из-за разнообразия и сложности названий скриптов мы обнаружили, что в результатах агрегирования все еще есть некоторые проблемы: 1) агрегируются товары, которые не принадлежат к одному и тому же скрипту, такие как «Аплодисменты» и «Аплодисменты». Ли 2 — это два разных сценария одной серии, но они объединены. 2) Товары, принадлежащие к одному шрифту, не агрегируются, например, в названиях товаров используются аббревиатуры письма («Детектив Чайнатауна и кот» и «Кот-детектив Тан») или опечатки («Якорь Флойда» и «Будда» ). Якорь Ллойда») и т. д., трудно собирать регулярно.
В ответ на две вышеупомянутые проблемы мы также рассматриваем возможность использования семантического сопоставления названий продуктов для агрегирования с точки зрения одной и той же текстовой семантики. Обычно используемые модели семантического сопоставления текста делятся на два типа: интерактивные и двухуровневые. Интерактивный заключается в том, чтобы одновременно ввести два фрагмента текста в кодировщик и позволить им обмениваться информацией друг с другом в процессе кодирования, прежде чем принимать решение; модель с двумя башнями использует кодировщик для кодирования двух текстов соответственно в векторы, а затем на основе два вектора для различения.
Из-за большого количества товаров интерактивный метод требует сочетания названий товаров, а затем прогнозирования модели, что неэффективно, поэтому для этого мы используем метод двойной башни.[3]На основе структуры модели BERT извлекает два текста названий товаров соответственно, а затем для измерения сходства между ними используется косинусное расстояние. Полная структура показана на рисунке 5 ниже:
В процессе обучения модели мы сначала строим укрупненные обучающие выборки на основе результатов агрегации правил и завершаем обучение исходной модели, генерируя положительные примеры в одном и том же кластере и перекрестно генерируя отрицательные примеры между кластерами. На этой основе дополнительно сочетайте активное обучение для улучшения выборочных данных. Кроме того, мы также объединяем две проблемы, возникающие в соответствии с упомянутыми выше правилами, и генерируем образцы в целевых пакетах. В частности, автоматическое построение образца реализовано путем добавления того же серийного номера после названия продукта и использования опечаток, других символов и традиционных символов для замены.
Мультимодальная агрегация
Синонимическая агрегация с семантического уровня текста наименования товара достигается за счет семантической агрегации, однако после повторного анализа результатов агрегации мы обнаружили, что проблемы все же есть: два товара относятся к одному и тому же сценарию, но только с точки зрения названия продукта не может быть дискриминационным. Например, «Выпуск 2» и «Вырезать мысль» не могут быть объединены с семантической точки зрения, но по сути являются сценарием «Выпуск 2·Вырезать мысль». Хотя названия этих двух продуктов разные, их изображения часто совпадают или похожи, поэтому мы рассматриваем возможность введения информации об изображениях продуктов для вспомогательной агрегации.
Простой метод заключается в использовании зрелой предварительно обученной модели в поле CV в качестве кодировщика изображений для извлечения признаков и прямого вычисления сходства изображений двух элементов. Чтобы унифицировать результаты расчета схожести изображений товаров и семантического сопоставления названий товаров, мы пытаемся построить мультимодальную модель сопоставления товаров, убивающих сценарии, в полной мере используя информацию о названии товара и изображении для сопоставления. Модель следует структуре двойной башни, используемой в семантической агрегации, а общая структура показана на рисунке 6 ниже:
В мультимодальной модели сопоставления имя и изображение товара, убивающего сценарии, соответственно представляются кодировщиком текста и кодировщиком изображения для получения соответствующего векторного представления, а затем объединяются в качестве конечного вектора товара и, наконец, косинусное сходство используется для измерения сходства товаров. в:
- кодировщик текста: Используйте текстовую предварительно обученную модель BERT.[1]В качестве текстового кодировщика вывод усредняется как векторное представление текста.
- кодировщик изображений: Предварительно обученная модель EfficientNet с использованием изображений.[4]В качестве кодировщика изображения выходные данные последнего слоя сети извлекаются как векторное представление изображения.
В процессе обучения модели кодировщик текста выполняет Finetune, а кодировщик изображений имеет фиксированные параметры и в обучении не участвует. Для построения обучающих выборок мы используем результаты семантической агрегации как основу для разграничения диапазона аннотированных вручную выборок по сходству товарных изображений. В частности, прямое создание положительных примеров с высоким сходством изображений товаров в одном и том же кластере и прямое создание отрицательных примеров с низким сходством изображений товаров в кластерах, в то время как остальные пары образцов аннотируются и определяются вручную. За счет мультимодальной агрегации он компенсирует недостаток использования только текстового сопоставления, а показатель точности увеличивается на 5% по сравнению с этим, что еще больше улучшает эффект майнинга стандартных скриптов.
3.2.2 Анализ стандартных атрибутов скрипта
Атрибуты стандартного сценария включают более десяти параметров, таких как предыстория, характеристики, жанр, тема и сложность сценария. Поскольку продавец будет вводить эти значения атрибутов товара, когда скрипт убивает товар и размещает заказ, добыча атрибута стандартного скрипта по сути является добычей атрибутов всех агрегированных товаров, соответствующих стандартному скрипту.
В самом процессе мы ведем майнинг через статистику голосования, то есть для определенного атрибута стандартного скрипта мы голосуем через значение атрибута соответствующего агрегированного продукта по атрибуту, и выбираем значение атрибута с наибольшим количеством голосов в качестве стандартный сценарий. Значение атрибута-кандидата равно , и окончательно подтверждено ручной проверкой. Кроме того, в процессе анализа имени стандартного скрипта мы обнаружили, что один и тот же скрипт имеет множество имен.Чтобы иметь лучшее описание стандартного скрипта, мы дополнительно добавили к стандартному скрипту атрибут псевдонима. имена всех соответствующих агрегированных продуктов очищаются и дедуплицируются для получения.
3.3 Снабжение и стандартные сценарии
После завершения создания стандартной библиотеки сценариев также необходимо установить три вида поставок продуктов для уничтожения сценариев, продавцов и контента, а также взаимосвязь между ними и стандартным сценарием, чтобы стандартизировать поставку средств для уничтожения сценариев. Поскольку связь между товаром и стандартным сценарием может быть получена напрямую, связь между товаром и стандартным сценарием может быть получена напрямую, поэтому нам нужно только связать товар и контент со стандартным сценарием.
3.3.1 Товарная ассоциация
В разделе 3.2 мы добывали стандартные сценарии, агрегируя биржевые сценарии для уничтожения товаров, В этом процессе мы фактически установили взаимосвязь между биржевыми товарами и стандартными сценариями. Для новых продуктов, добавленных в будущем, нам также необходимо сопоставить их со стандартным скриптом, чтобы установить взаимосвязь между ними. Для продуктов, которые нельзя связать со стандартными скриптами, мы автоматически извлекаем имена и атрибуты стандартных скриптов, а затем добавляем их в стандартную библиотеку скриптов после проверки вручную.
Весь процесс сопоставления продуктов показан ниже на рисунке 7. Сначала имя продукта очищается, а затем сопоставляется и связывается. В процессе сопоставления мы сопоставляем и различаем продукт и стандартный сценарий на основе мультимодальной информации имени и изображения.
В отличие от сопоставления между элементами, для сопоставления элементов со стандартными книгами воспроизведения не требуется поддерживать симметрию сопоставления. Чтобы обеспечить эффект ассоциации, мы модифицируем структуру мультимодальной модели сопоставления в разделе 3.2.1.После сращивания векторов товара и стандартного сценария вероятность ассоциации между ними рассчитывается с помощью полностью связанный слой и слой softmax. Обучающие выборки построены непосредственно на основе связи между биржевыми товарами и стандартными сценариями. Через товарную ассоциацию мы добились стандартизации большинства товаров, убивающих сценарий.
3.3.2 Ассоциация контента
Связывание стандартных сценариев с контентом, убивающим сценарии, в основном направлено на установление связи между пользовательским контентом (UGC, таким как отзывы пользователей) и стандартными сценариями. Поскольку текст пользовательского контента обычно содержит несколько предложений, и только некоторые из предложений будут ссылаться на соответствующую информацию стандартного сценария, мы уточняем соответствие пользовательского контента и стандартного сценария сопоставлению детализации предложений, и в то же время для ради эффективности и эффекта. С учетом баланса процесс сопоставления делится на два этапа: отзыв и сортировка, как показано на рисунке 8 ниже:
На этапе отзыва текст пользовательского контента делится на пункты, и в соответствии со стандартным именем сценария и его псевдонимом выполняется точное совпадение в наборе предложений, и совпадающие предложения переходят в фазу сортировки для уточнения различения ассоциаций.
На этапе сортировки реляционная дискриминация преобразуется в проблему классификации на основе аспектов, ссылаясь на практику классификации настроений на уровне атрибутов.[5], построить модель сопоставления на основе классификации отношений между предложениями BERT, соединить стандартный псевдоним сценария, который фактически попадает в предложение UGC, и соответствующее предложение UGC с [SEP], а затем ввести, добавив полностью подключенный слой и слой softmax. после BERT для достижения того, подвергается ли связанная бинарная классификация и, наконец, вероятность классификации, выводимая моделью, пороговому скринингу для получения стандартного сценария, связанного с пользовательским контентом.
В отличие от обучения моделей, описанного выше, модели сопоставления для пользовательского контента и стандартных сборников игр не могут быстро собрать большое количество обучающих образцов. Учитывая отсутствие обучающих выборок, мы сначала разметили сотни образцов вручную, на этой основе, помимо использования активного обучения, мы также попробовали сравнительное обучение, основанное на Regularized Dropout.[6]метод регуляризации вывода модели дважды Dropout. В конце концов, когда обучающая выборка была меньше 1 тыс., точность стандартных скриптов, связанных с пользовательским контентом, достигла онлайн-требований, а количество пользовательского контента, связанного с каждым стандартным скриптом, также значительно увеличилось.
4. Практика применения
Текущая карта знаний, уничтожающая сценарии, сосредоточена на тысячах стандартных сценариев и связана с миллионами расходных материалов. Результаты стандартизации конструкции уничтожения и поставки скриптов изначально применялись в нескольких бизнес-сценариях Meituan. Конкретные методы применения и эффекты применения описаны ниже.
4.1 Категория Строительство
Посредством добычи ресурсов для уничтожения сценариев он помогает предприятиям идентифицировать торговцев, убивающих сценарии, тем самым помогая в создании новых категорий уничтожения сценариев и соответствующих страниц списка уничтожения сценариев. Были запущены миграция категории уничтожения скриптов, запись об уничтожении скриптов на странице канала досуга и развлечений и страница со списком уничтожения скриптов.Среди них, ЗНАЧОК уничтожения скриптов на странице канала зафиксирован в верхней части третьей строки, обеспечение централизованного входа трафика, что помогает установить единое сознание пользователей. Онлайн-пример показан на рис. 9 ((а) запись сценария на странице канала досуга и развлечений, (б) страница списка запрещенных сценариев).
4.2 Персональные рекомендации
Стандартные узлы сценариев и атрибутов, включенные в граф знаний об уничтожении сценариев, а также их взаимосвязь с поставками и пользователями, могут быть применены к рекомендательной позиции каждой страницы уничтожения сценариев. С одной стороны, он применяется к рекомендации популярных скриптов на странице со списком скриптов (рис. 10(а)), а с другой — к рекомендации продуктов на странице сведений о скрипте в игра (рис. 10(b) слева) и рекомендации игрового магазина (рис. 10 (рис. 10(b) слева) и соответствующий модуль рекомендаций по сценариям (рис. 10(b) справа). Применение этих позиций рекомендаций помогает развивать умы пользователей, чтобы находить сценарии на платформе, оптимизировать познание пользователей и покупательский опыт, а также повышать эффективность сопоставления между пользователями и предложением.
Взяв в качестве примера популярный модуль рекомендации сценариев на странице со списком сценариев, узлы и отношения, содержащиеся в графе знаний об уничтожении сценариев, можно не только напрямую использовать для отзыва сценариев, но и в дальнейшем применять на этапе уточнения. В доработке мы убиваем карту знаний на основе скрипта в сочетании с поведением пользователя, обратитесь к Deep Interest Network (DIN)[7]Структура модели, пытается моделировать последовательность пользователя для доступа к сценарию и последовательности доступа к продукту, построить двухканальную модель DIN и включить интерес пользователя для реализации персонализированного распределения скрипта. В некоторых последовательностях товарных доступов ассоциация между продуктом и стандартным сценарием преобразуется в последовательность сценариев, а сценарий кандидата моделируется в способе внимания, а конкретная структура модели показана на рисунке 11:
4.3 Раскрытие и проверка информации
На основе узлов и взаимосвязей в графе знаний об уничтожении сценариев добавьте соответствующие элементы фильтрации тегов на страницу списка уничтожения сценариев и на страницу списка сценариев, а также предоставьте атрибуты и связанную с ними информацию о ресурсах сценария. Связанные приложения показаны на рисунке 12 ниже. Эти элементы фильтрации меток и раскрытие информации предоставляют пользователям стандартизированное отображение информации, снижают затраты пользователей на принятие решений и упрощают пользователям выбор магазинов и сценариев.
4.4 Рейтинги и рейтинги
На странице сведений о сценарии взаимосвязь между содержимым и стандартным сценарием участвует в расчете оценки сценария (рис. 13(a)). На этой основе, в зависимости от параметра сценария, формируется список классических обязательных к воспроизведению и последних популярных сценариев, как показано на рис. 13(b), который помогает пользователям принимать решения о выборе сценария.
V. Резюме и перспективы
Столкнувшись с развивающейся отраслью уничтожения сценариев, мы быстро реагируем на бизнес, берем стандартный сценарий в качестве основного узла, комбинируем отраслевые характеристики и создаем соответствующую карту знаний посредством извлечения ресурсов для уничтожения сценариев, построения стандартной библиотеки сценариев, сопоставления поставок и стандартных сценариев, от 0 до 1, постепенно продвигайте стандартизацию поставки сценариев уничтожения и стремитесь решить проблему уничтожения сценариев простым и эффективным способом.
В настоящее время карта знаний по уничтожению сценариев достигла результатов применения в нескольких бизнес-сценариях уничтожения сценариев, что обеспечивает непрерывный рост бизнеса по уничтожению сценариев и значительно улучшает взаимодействие с пользователем. В дальнейшей работе мы продолжим оптимизировать и исследовать:
- Стандартная библиотека сценариев продолжает улучшаться: Оптимизируйте стандартные имена и атрибуты сценариев и соответствующие отношения поставки, чтобы обеспечить качество и количество стандартной библиотеки сценариев, и попытайтесь внедрить внешние знания, чтобы дополнить текущие результаты стандартизации.
- Сценарий убивает сцену: Текущая карта знаний об уничтожении сценариев в основном основана на конкретных потребностях пользователей, таких как «сценарии». способствовать развитию индустрии убийства сценариев.
- Дополнительные приложения для изучения: Применяйте графические данные к таким модулям, как поиск, чтобы повысить эффективность согласования поставок в большем количестве сценариев приложений, тем самым создавая большую ценность.
использованная литература
[1] Devlin J, Chang M W, Lee K, et al. Bert: Pre-training of deep bidirectional transformers for language understanding[J]. arXiv preprint arXiv:1810.04805, 2018.
[2] Lample G, Ballesteros M, Subramanian S, et al. Neural architectures for named entity recognition[J]. arXiv preprint arXiv:1603.01360, 2016.
[3] Reimers N, Gurevych I. Sentence-bert: Sentence embeddings using siamese bert-networks[J]. arXiv preprint arXiv:1908.10084, 2019.
[4] Tan M, Le Q. EfficientNet: Rethinking model scaling for convolutional neural networks[C]//International Conference on Machine Learning. PMLR, 2019: 6105-6114.
[5] Sun C, Huang L, Qiu X. Utilizing BERT for aspect-based sentiment analysis via constructing auxiliary sentence[J]. arXiv preprint arXiv:1903.09588, 2019.
[6] Liang X, Wu L, Li J, et al. R-Drop: Regularized Dropout for Neural Networks[J]. arXiv preprint arXiv:2106.14448, 2021.
[7] Zhou G, Zhu X, Song C, et al. Deep interest network for click-through rate prediction[C]//Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018: 1059-1068.
об авторе
Li Xiang, Chen Huan, Zhihua, Xiaoyang, Wang Qi и другие пришли из отдела технологии платформы Meituan Daodian в комплексную группу бизнес-данных.
Предложения о работе
Отдел технологии платформы Meituan Daodian - группа бизнес-данных Daozong, долгосрочный алгоритм найма (алгоритм обработки естественного языка / рекомендации), хранилище данных, наука о данных, разработка систем и другие должности, расположенные в Шанхае. Заинтересованные студенты могут направить свои резюме по адресу:licong.yu@meituan.com.
Прочтите другие подборки технических статей от технической команды Meituan
внешний интерфейс | алгоритм | задняя часть | данные | Безопасность | Эксплуатация и техническое обслуживание | iOS | Android | контрольная работа
|Ответьте на ключевые слова, такие как [акции 2020 г.], [акции 2019 г.], [акции 2018 г.], [акции 2017 г.] в диалоговом окне строки меню общедоступной учетной записи, и вы сможете просмотреть коллекцию технических статей технической группы Meituan в течение годы.
| Эта статья подготовлена технической командой Meituan, авторские права принадлежат Meituan. Добро пожаловать на перепечатку или использование содержимого этой статьи в некоммерческих целях, таких как обмен и общение, пожалуйста, укажите «Содержимое воспроизводится технической командой Meituan». Эта статья не может быть воспроизведена или использована в коммерческих целях без разрешения. Для любой коммерческой деятельности, пожалуйста, отправьте электронное письмо по адресуtech@meituan.comПодать заявку на авторизацию.