Анализ механизма контекстной рекламы партнерского маркетинга eBay

искусственный интеллект алгоритм NLP продукт
Анализ механизма контекстной рекламы партнерского маркетинга eBay
Эта статья была изначально создана "AI Frontline", оригинальная ссылка:Анализ механизма контекстной рекламы партнерского маркетинга eBay
Автор|eBay
Переводчик|Самбодхи
Редактор | Наталья

Руководство по передовой ИИ:Контекстная реклама — это онлайн-реклама, соответствующая содержанию, например, когда пользователь просматривает информацию в Интернете, если он видит статью об автомобилях, он увидит рекламу, связанную с продажей автомобилей, автострахованием и автомобильными журналами. Контекстная реклама станет прелюдией к умной рекламе. Контекстная реклама партнерского маркетинга eBay очень хороша, сегодня мы рассмотрим, как eBay доводит собственную контекстную рекламу до крайности.


eBay использует различные маркетинговые каналы для привлечения новых и существующих клиентов на сайт, одним из которых является партнерская программа eBay. eBay также предлагает наборы инструментов, которые помогут издателям/аффилированным лицам увеличить свои комиссионные. Существуют инструменты, которые создают отслеживаемые ссылки при совершении покупок на сайте eBay. Что касается более сложных инструментов, таких как наш API, он может поддерживать индивидуальный доступ к данным списка продуктов eBay. Например, пользователи могут создавать баннеры, чтобы добавлять объявления eBay в режиме реального времени на свой веб-сайт. В этой статье обсуждается, как размещать контекстную рекламу на сайтах издателей на основе содержания страницы. Основные моменты этого подхода включают:

  • В зависимости от содержания страницы алгоритм определяет, как идентифицировать заголовок/связанные ключевые слова страницы.
  • Игнорируйте беспорядочный HTML-контент и фильтруйте только релевантные и важные ключевые слова.
  • Масштабируйте по мере увеличения количества URL-адресов без потери релевантности рекомендуемых ключевых слов.
  • Предоставляет релевантные записи eBay для представления на страницах издателей с использованием проверенных и проверенных алгоритмов поиска eBay.
  • Алгоритм рендеринга элемента срабатывает только тогда, когда страница возвращает положительное настроение. Мы создали алгоритмы прогнозирования настроений для каждой HTML-страницы на основе содержания и контекста.

Модель партнерского маркетинга

Партнерский маркетинг — это реферальная онлайн-программа, в которой продавцы платят издателям комиссию за продажи привлеченных ими клиентов.

AI Frontline: партнерский маркетинг, китайский язык можно понимать как партнерское продвижение, также известное как партнерский маркетинг Метод расчета комиссии — оплата за транзакцию, то есть CPS. Преимущество партнерского маркетинга в том, что комиссии, как правило, объективны. Партнерский маркетинг — это давно зарекомендовавший себя способ продвижения продукта, при котором вы продвигаете продукт кому-то, и когда этот человек покупает продукт через вашу рекламу, вы получаете комиссию. Размер комиссии зависит от продукта, который вы продвигаете.


Существует множество способов показа релевантной рекламы клиентам, посещающим сайты наших партнеров:

  1. Показывая контент, с которым пользователи взаимодействовали на eBay в прошлом (также известный как реклама с ретаргетингом), мы нацеливаем их как идентичные, похожие или взаимодополняющие элементы. (Процент возник, мы пытаемся перевести клиентов путем покупки.)
  2. Предоставляя записи eBay из ключевых слов, предоставленных издателем. (Используйте службу поиска eBay для предоставления записей на основе ключевых слов, предоставленных издателем)
  3. Вдохновляйте пользователей на подписку или покупку на eBay в зависимости от того, что они просматривают.
AI Frontline: так называемая ретаргетинговая реклама — это точный метод доставки в рекламе производительности. В процессе совершения покупок потребителями, часто по тем или иным причинам, конверсия в итоге не завершается. Ретаргетинговая реклама размещает продукты перед такими неконвертированными потребителями, возвращая их на соответствующую веб-страницу. Поскольку отображаемые продукты часто являются тем, чего больше всего хотят потребители, коэффициент конверсии ретаргетинговой рекламы выше, чем у обычной рекламы.

В этой статье мы обсудим, как предоставлять контекстно-релевантную рекламу, и обсудим некоторые алгоритмы, которые мы используем для достижения наших бизнес-целей.

Алгоритм 1: на основе тематического моделирования и заголовков страниц

Поток обработки:

  1. Поиск на сайтах издателей.
  2. Сканировать контент издателя.
  3. Определите, отражает ли контент положительные или нейтральные настроения.
  4. Используйте методы обработки естественного языка, чтобы определить релевантные ключевые слова на интересующих страницах.
  5. Основываясь на ключевом слове, вызовите поисковый API, чтобы получить верхний элемент слова и поделиться им на веб-странице издателя.

Подробный процесс:

  1. Поиск на сайтах издателей. Используйте собственный поисковый робот для поиска на сайтах издателей. Поисковые роботы сканируют и возвращают HTML-файлы для URL-адресов издателей. (Издатели явно выбирают этот таргетинг и поэтому понимают и позволяют нам сканировать их сайты.)
  2. Сканировать контент издателя: Сканировать по<p>HTML-файл, описывающий тег содержимого. Также берите теги<div>ниже, чтобы мы могли получить более подробную информацию о странице. Алгоритм будет обрабатывать нежелательный контент на странице.
  3. Определите настроение страницы:

Алгоритм: сгенерируйте набор слов для содержимого страницы, накажите за отрицательные слова и вознаградите за положительные слова, а затем рассчитайте оценку для всей страницы.

  • После сканирования страницы мы очищаем содержимое веб-сайта, удаляя стоп-слова, специальные символы, знаки препинания, пробелы и т. д., чтобы получить матрицу терминов документа (DTM). DTM содержит список слов на странице и связанные с ними подсчеты частоты (часто также термин частоты).
  • Затем мы запускаем три отдельных общих словаря настроений, таких как AFINN, Bing и nrc (составлены Финном Арупом Нильсеном, Бингом Лю и их сотрудниками Саифом Мохаммадом, Питером Терни). Все три словаря основаны на униграммах, то есть на отдельных словах. Эти словари содержат много английских слов, которым присваиваются баллы за положительные/отрицательные эмоции и, возможно, такие эмоции, как лайк, гнев, грусть и т. д. Словарь nrc классифицирует слова в бинарной форме (да/нет) на положительные, отрицательные, гнев, ожидание, задержку, страх, радость, печаль, удивление и доверие. Словарь Bing делит слова на две категории: «положительные» и «уничижительные» «бинарным» способом. Словарь AFINN, с другой стороны, оценивает слова по шкале от -5 до 5, где отрицательные оценки указывают на отрицательные эмоции, а положительные оценки указывают на положительные эмоции.
  • Страница должна иметь два из трех словарей, чтобы возвращать положительную оценку, чтобы URL-адрес считался положительным числом.

Этот простой и легкий способ обнаружения эмоций является мощным и точным, и мы создали инструмент человеческого суждения, чтобы оценить эффективность алгоритма. Был достигнут уровень ошибочной классификации 16%, что означает, что в 84% случаев алгоритм предсказывал фактическую тональность страницы.

4. Определите релевантные ключевые слова

  • На основе контента:Мы используем выборку Гиббса (Gibbs Sampling) для запуска алгоритма моделирования темы LDA для получения двух тем, каждая тема имеет три ключевых слова, а термин с наибольшей вероятностью используется в качестве ключевого слова страницы. Слова меньше одного раза удаляются из набора.
  • Судя по заголовку страницы:Мы извлекаем заголовок страницы, анализируем его и отфильтровываем существительные (в единственном и множественном числе), имена собственные (в единственном и во множественном числе), иностранные слова и количественные числительные, а также извлекаем первые три ключевых слова в зависимости от их частоты на странице на основе название .

Затем ключевые слова, сгенерированные двумя вышеуказанными методами, объединяются, и из комбинации извлекаются первые три уникальных ключевых слова в соответствии с частотой появления страницы.

Границы ИИ: выборка Гиббса — это частный случай алгоритма Метрополиса Гастингса. Алгоритм MH использует тщательную балансировку цепей Маркова для получения выборки из совместного распределения. С помощью выборки совместного распределения мы можем получить маргинальное распределение, которое играет важную роль в нахождении апостериорного распределения в байесовском выводе.

Концепции тематического моделирования

  • Тематическое моделирование — это неконтролируемый метод, который автоматически идентифицирует темы, которые появляются в тексте, и выводит скрытые шаблоны, демонстрируемые текстовыми корпусами. Грубо говоря, тема - это распределение вероятностей по набору терминов в словаре, которое можно рассматривать как «повторяющийся набор терминов, которые одновременно встречаются в корпусе».
  • Тематические модели отличаются от подходов, основанных на правилах, тем, что они используют регулярные выражения или методы поиска по ключевым словам на основе словаря.
  • Мы используем скрытое распределение Дирихле (LDA) для тематического моделирования. Это метод матричной факторизации, вероятностная версия скрытого семантического индексирования (LSI), который пытается извлечь скрытые факторы в данных, «темы».
AI Frontline: скрытое распределение Дирихле, сокращенно LDA (латентное распределение Дирихле), представляет собой модель темы, которая дает тему каждого документа в наборе документов в форме распределения вероятностей. В то же время это неконтролируемый алгоритм обучения, который не требует вручную размеченного обучающего набора во время обучения, а нуждается только в наборе документов и количестве k заданных тем. Еще одним преимуществом LDA является то, что для каждой темы есть несколько слов для ее описания. LDA был впервые предложен Блеем, Дэвидом М., Нг Эндой и Джорданом, Майклом I в 2003 году, и в настоящее время он используется в области анализа текста, включая распознавание тем текста, классификацию текста и вычисление сходства текста. С точки зрения непрофессионала, это можно понять так: Пусть компьютер размышляет и анализирует темы каждой статьи в Интернете для людей, и какова вероятность (тематическое распределение) каждой темы в каждой статье. Короче говоря, это сделать вывод о распределении темы данного документа.

Алгоритм 2: На основе заголовка страницы

Алгоритм основан на частоте слов в заголовках страниц и подзаголовках.

  • После сканирования сайта (мы используем HTML-теги<div>и<p>Содержимое в ), очистите содержимое сайта, удалив стоп-слова, специальные символы, знаки препинания, пробелы и т. д., и получите документы, содержащие списки слов и связанных с ними частот.
  • Затем мы получаем только заголовок и подзаголовок страницы (<h1прибытьh6>) для фильтрации только существительных (единственного и множественного числа), имен собственных (единственного и множественного числа), иностранных слов и количественных числительных в заголовках и подзаголовках.
  • Затем мы берем три наиболее распространенных заголовка/подзаголовка на фактическом содержании страницы и передаем эти три ключевых слова в службу поиска.

5. Вызовите API поиска eBay, чтобы получить ключевые слова. После того, как ключевые слова предоставлены для каждой страницы, они передаются в наш API службы поиска для получения рекомендаций по товарам.

Пример

URL: Вызов дурака.com/2017/10/25/…

Алгоритм 1 показывает памятные вещи из «Очень странных дел», а алгоритм 2 показывает постер с демоном из «Очень странных дел». Это связано с тем, что в алгоритме 1 отсутствует ключевое слово «плакат», о котором и пойдет речь в этой статье.

Мы выбрали Алгоритм 2 и Алгоритм 1 из пользовательского инструмента оценки и сравнили, Алгоритм 2 превзошел Алгоритм 1.

результат:В процессе сбора отзывов с большого количества URL-адресов этот простой и эффективный алгоритм, после многих раундов ручной оценки, мы обнаружили, что:

  • Алгоритм тональности, который запускал алгоритм генерации ключевых слов, смог предсказать правильную тональность страницы до 84%.
  • По сравнению с Алгоритмом 1, Алгоритм 2 для ключевых слов и последующее создание товара на eBay дал более высокие оценки обратной связи (из 5 в Инструменте человеческого суждения, более 3,5).
  • Каждый URL-адрес имеет новый алгоритм предсказания категории eBay, который используется, если нет результатов алгоритма генерации ключевых слов.
  • Кроме того, команда Marketing Data Science работает над созданием аналогичных списков товаров eBay на основе изображений, отображаемых на странице. Кроме того, команда создает разумный механизм списка записей eBay для отзыва изображений, которые появляются на страницах издателя. (т. е. если на странице издателя есть изображения гор, алгоритмы не должны использовать эти изображения в качестве начальных изображений при рендеринге элементов, связанных с eBay, для изображений.)
  • После создания этих различных методов таргетинга группа специалистов по маркетинговым данным планирует построить модель машинного обучения, чтобы определить, как различные методы таргетинга (на основе контекстно-релевантных ключевых слов, изображения на основе ключевых слов, предоставленных издателями, на основе таргетинга) и адаптироваться к различным клиенты, посещающие одну и ту же страницу.

В заключение, если издатели могут предоставлять контекстуально релевантные записи eBay на своих страницах, никаких действий не требуется, просто зарегистрируйтесь в программе, и мы получим благоприятную экосистему для издателей, покупателей, продавцов и системы eBay.

Исходная ссылка: Контекстная реклама для партнерки eBayWoohoo. Bully Ginzo.com/stories/No...

Для большего содержания сухих товаров вы можете обратить внимание на AI Frontline, ID:ai-front, фоновый ответ "AI", "TF", "Большие данные«Вы можете получить серию мини-книг и карт навыков в формате PDF «AI Frontline».