Рождение oCPX
Когда интернет-реклама впервые появилась, рекламодатели выкупали рекламу в месте размещения в зависимости от продолжительности или размещали рекламу в зависимости от количества показов рекламы. Этот метод аналогичен традиционному методу телевизионной рекламы. Баннеры некоторых веб-сайтов и открытая реклама большинства приложений, которые мы видим сейчас, относятся к этому методу рекламы, и эти рекламодатели размещают рекламу с целью продвижения бренда.
Для этого типа рекламы характерна плохая персонализация, эту рекламу увидят все пользователи, смотрящие эту телепрограмму или открывающие эту веб-страницу, поэтому многие мужчины увидят рекламу косметики по телевизору, а женщины увидят рекламу Nike, но на самом деле большинство они не заинтересованы в этой марке продукции, и будет больше траты рекламного трафика. Рекламодатели, размещающие рекламу бренда, не слишком обеспокоены такой тратой трафика и не требуют от пользователей покупать товары сразу после просмотра рекламы, что может повысить осведомленность общественности о бренде в долгосрочной перспективе.
Как правило, те, кто может размещать рекламу бренда, являются крупными рекламодателями и уделяют больше внимания долгосрочному эффекту бренда. Но многие мелкие и средние рекламодатели предпочитают иметь точку входа и точку выхода. После появления коммерческих поисковых систем, таких как Google и Baidu, реклама с эффектом клика и удержания стала широко пропагандироваться и применяться и на долгое время стала основным методом интернет-рекламы. рисунок
После того, как рекламодатель разместит рекламу, она появится на странице результатов поиска или на странице рекомендации контента. Сам показ рекламы является бесплатным, а плата за рекламу будет вычтена только после того, как пользователь нажмет на рекламу. Такая реклама сделает рекламный эффект более контролируемым для рекламодателей, а вычет за рекламу принесет посещение пользователя, а не просто оплату рекламного сбора.Все остальные аспекты не гарантируются. И вообще говоря, пользователи заинтересованы в нажатии на рекламную ссылку, и пользователь будет иметь определенное отношение к содержанию рекламы, что в определенной степени улучшит конверсию рекламы и пользовательский опыт.
Для рекламной платформы можно продавать показы разных пользователей разным рекламодателям, что более выгодно, чем продавать показы всех пользователей одному и тому же рекламодателю. С другой стороны, это также выдвигает более высокие требования к платформенной технологии: платформа должна точно оценивать кликабельность (ctr) каждого объявления-кандидата пользователями, сортировать их по показателю ctr*bid и постоянно оптимизировать оценку ctr. модели, чтобы более разумно объединять пользователей с рекламодателями, чтобы увеличить доход платформы.
В течение долгого времени интернет-реклама в основном основывалась на системе «нажми и удерживай» (CPC), и рекламодатель несет ответственность за ее продвижение. Таким образом, для рекламодателей реальная стоимость конверсии на самом деле не так уж и контролируема, после перехода по рекламной ссылке покупок у рекламодателя в итоге может и не быть. С другой стороны, это также побуждает некоторых рекламодателей размещать заголовки или SEO-рекламу, так что модель оценивает pCtr как высокий, чтобы дешево привлекать пользователей. По сути, это разрушает пользовательский опыт, а также разрушает рекламную экологию.
Воронка конверсии интернет-рекламы очень глубокая, на примере игрового приложения весь процесс конверсии рекламы просто включает 6 этапов: запрос, показ, клик, загрузка, регистрация и оплата. рекламные клики.На самом деле рекламодатели хотят, чтобы пользователи платили, и они хотят иметь возможность размещать рекламу в зависимости от того, сколько стоит платящий пользователь.
На самом деле, таким образом взимаются такие сборы, как продажа жилья и аренда, и определенный процент комиссии платформы вычитается из суммы сделки с домом. Таким образом, независимо от того, сколько людей приведут посмотреть дом, плата не взимается, взимается только транзакция. Метод дивергенции CPC в этом сценарии: посредник приводит людей посмотреть дом (диверсия). Будет взиматься плата в размере 3-5 юаней.Совершение сделки зависит от собственных маркетинговых методов домовладельца. Условно говоря, домовладельцы будут более склонны платить комиссионные.
Мы называем метод вычета по конверсии CPA, и при использовании метода CPA в интернет-сценарии возникает много проблем.
- Существует задержка в конверсионном поведении, и плата не может быть вычтена, когда происходит конверсионное поведение.
- Точные данные о конверсиях находятся в руках рекламодателей, и интернет-сцена не может сопровождать весь процесс как настоящий посредник.
- Необходимо связаться со многими мелкими и средними рекламодателями, их технический уровень не высок, а процесс возврата данных о конверсиях подвержен проблемам.
Основываясь на вышеупомянутых 3 пунктах, учитывая, что метод CPA трудно внедрить в Интернете, повышение коэффициента конверсии рекламного бэкэнда и снижение стоимости конверсии всегда было направлением всех усилий. Долгое время рекламодателям предлагалось выбирать для показа крауд-таргетинговые теги, тем самым повышая коэффициент конверсии. , но в самом лендинге есть неудовлетворительные места.
В последние годы некоторые ведущие компании, такие как Facebook и Toutiao, запустили методы доставки oCPC, чтобы обеспечить внутренние затраты на конверсию. Модель по-прежнему вычитает плату за рекламу, когда пользователь нажимает, но цена вычета здесь не предыдущая фиксированная цена, а цена, рассчитанная в соответствии с коэффициентом конверсии рекламного бэкенда; bid=CPA*pCvr, где CPA — ставка конверсии пользователя. Например, платящий пользователь — 100 юаней, pCvr — вероятность конверсии (платежа) по клику, оцененная моделью. Поскольку плата по-прежнему удерживается в момент клика, у рекламодателя нет стимула для обмана при возврате данных о конверсиях. Общий риск разделяется между платформой и покупателем. Изменение данных о конверсиях только ухудшит эффект модели. и эффект преобразования неуправляем. В то же время на принципиальном уровне можно контролировать стоимость, что может удовлетворить потребности рекламодателей, а с точки зрения платформы распределение трафика более разумно, доход больше, а экология рекламы лучше. . Просто фактическая инженерная реализация платформы будет сложнее, технических проблем будет больше, и будет определенное отклонение между фактической стоимостью конверсии и CPA.
Помимо oCPC, существуют и другие методы доставки, такие как oCPM и oCPD. Принципы аналогичны и в совокупности называются oCPX.
Техническая архитектура алгоритма oCPX
Прежде всего, необходимо установить модуль атрибуции возврата данных о конверсиях в реальном времени, чтобы хранить данные о конверсиях, возвращаемые рекламодателями, в разные категории и правильно их атрибутировать (связать данные о конверсиях с кликами, которые привели к конверсии). . Данные являются краеугольным камнем системы алгоритмов. Без данных не существует всей системы алгоритмов. Поток данных в реальном времени должен быть стабильным и надежным.
Второй модуль — это модуль обучения модели, который будет отслеживать данные о кликах по объявлениям и конверсиях, а также моделировать коэффициент конверсий по кликам, то есть устанавливать модель для оценки условной вероятности P (конверсия = 1 | клик = 1). На уровне функций модели повторно используется большинство функций модели ctr, а также добавляются статистические функции функций cvr и целевой страницы, чтобы выразить взаимосвязь между пользователями и поведением конверсии. Модель передается в онлайн-сервис для оценки коэффициента клик-конверсия pCvr для каждого объявления-кандидата.
Для обеспечения контролируемости стоимости рекламы и корректировки расчетного отклонения модели в рекламном измерении нам также необходим модуль контроля затрат в режиме реального времени. Он будет подсчитывать фактическую стоимость каждого объявления в день и ожидаемую стоимость рекламодателя в режиме реального времени и использовать алгоритмы промышленного контроля для корректировки общей ставки для каждого объявления. Если стоимость объявления слишком высока, общая ставка объявления будет снижена, чтобы фактическая стоимость конверсии объявления соответствовала ожидаемой стоимости рекламодателя, и наоборот.
В службе онлайн-рейтинга (рейтинге) нам необходимо оценить коэффициент конверсии pCvr каждого рекламного объявления-кандидата в соответствии с целями его показа (может быть загрузка, активация, регистрация, оплата...) в сочетании с ценой за конверсию рекламодателя и ценой за конверсию. коэффициент управления рекламной ставкой k, рассчитанный модулем управления, используется для вычисления интеллектуальной ставки bid=pCvrCPAk для этого клика по рекламе. После получения ставки клика вместе с другими рекламными объявлениями с оплатой за клик проведите общий комплексный рекламный аукцион в форме score=pCtr*bid. После нескольких стратегий сортировки выигравшая реклама, наконец, выбирается и отправляется клиенту для показа рекламы.
Сложность всей системы данных и алгоритмов относительно высока, и проблемы могут возникать в каждом звене.Важен модуль отладки и анализа случаев. Здесь некоторые данные отладки будут сообщены на стороне ранкера и введены в наш модуль анализа случаев.Мы можем следить за фактически наблюдаемыми проблемами и отзывами рекламодателей для отслеживания и позиционирования, а также своевременно настраивать систему и оптимизировать ее.
Введение в технологию моделирования CVR
Модель прогнозирования Cvr является ядром системы oCPX, и ее влияние сильно повлияет на конечный доход платформы и отклонение затрат на рекламу.
До моделирования модели Cvr на самом деле существует модель прогнозирования Ctr, но одна предназначена для моделирования конверсии кликов, а другая — для моделирования кликов экспозиции. На самом деле, при моделировании Cvr еще предстоит преодолеть множество технических трудностей.
1. Расчетные требования к точности выше
Для pCtr есть определенное отклонение в результатах технического прогноза, пока отклонение не влияет на окончательный результат торгов, все в порядке, тогда как pCvr напрямую влияет на кликовую ставку и стоимость рекламы, даже если отклонение составляет 5 %, это будет отражать цену рекламодателя. С точки зрения стоимости конверсии у рекламодателей есть четкое восприятие. pCvr необходимо оценивать более точно. В соответствии с проблемой расчетного отклонения, вообще говоря, требуется калибровка pCvr в дополнение к оптимизации модели.Значение pCvr, оцененное моделью, сравнивается с фактическим статистическим значением Cvr, и калибровка выполняется с помощью регрессионной модели, сохраняющей порядок. .
2. Проблема разреженных и необъективных выборок более серьезна
Все образцы нашей обучающей модели обучены тому, конвертируется ли пользователь после нажатия.Эти образцы представляют собой случаи, когда окончательная ставка выиграна и пользователь нажал, что доказывает, что пользователь хорошо соответствует рекламе. При онлайн-оценке оцениваются все рекламные объявления-кандидаты. Таким образом, мы как будто хотим создать модель для оценки оценок национального дохода, а обучающие выборки для моделирования используют только выборки из Шэньчжэня Проблема систематической ошибки выборки является более серьезной.
Проблема смещения выборки может быть смягчена и оптимизирована с помощью совместного моделирования.Существуют две основные модели, ESMM и MMoE, которые можно выбрать.В настоящее время фактически обнаружено, что совместное моделирование типов множественных преобразований MMoE может улучшить модель. эффект в определенной степени. Эффект ESMM не очевиден.
3. Преобразование задержки
В настоящее время модель обновляется путем добавочного обучения, а задержка поведения глубокого преобразования относительно велика.Если не выполняется специальная обработка, то легко сначала выполнить щелчок и ввести модель как отрицательный образец для обучения. Через несколько дней пользователь оплачивает ее, после чего использует положительный образец для обучения модели Enter. С одной стороны, обучение неточно, а с другой стороны, оно склонно к недооценке большого коэффициента конверсии для вновь запущенных рекламных объявлений. Эта проблема с задержкой будет еще больше для модели Ctr.
Здесь мы считаем, что 7 дней — это максимальное окно для перекомпоновки поведения конверсии (которое может охватывать более 95% случаев). поэтому у этой модели нет проблемы с задержкой преобразования.
Затем данные положительной и отрицательной выборки за последние 7 дней будут обновляться каждый день, а вес выборки будет корректироваться в соответствии с ежедневной конверсией и коэффициентом возврата, чтобы уравнять соотношение положительной и отрицательной выборки. Затем мы создадим модель T-7 и выполним дополнительное обучение с взвешенными выборочными данными за последние 7 дней, чтобы получить модель T-0. Таким образом, модель T-0 уравнивает проблему отложенного преобразования с точки зрения выборки соотношение.
Введение в стратегии контроля затрат
Целевые средства сделают оценку модели cvr более точной, но отклонения в оценке будут неизбежны, особенно данные о конверсии относительно скудны, а фактический объем конверсии подвержен большим колебаниям. Следовательно, необходим модуль контроля затрат, чтобы гарантировать рекламодателю достижение стоимости. Здесь вводятся несколько понятий:
Фактическое потребление: сумма, вычтенная рекламодателем в день Ценность рекламодателя: в случае выставления счетов за конверсию сумма, которая должна быть вычтена в день Коэффициент потребления = фактическое потребление / значение рекламодателя, модуль управления приближает коэффициент потребления к 1,0, так что фактическое потребление приближается к значению рекламодателя. Модуль стратегии управления рассчитает коэффициент k ставки рекламного параметра, bid=CPApCvrk, чтобы скорректировать ставку рекламного параметра.
Сначала мы использовали метод пропорционального регулирования, k=1,0/коэффициент расхода. Идея относительно проста: если фактическое потребление в два раза превышает стоимость рекламодателя, то каждый раз, когда вы делаете ставку в два раза меньше предыдущей цены, можно достичь ожидаемых затрат рекламодателя. Однако на самом деле процесс управления также влияет на коэффициент потребления.В конце концов, вышеприведенную ситуацию можно контролировать только до 1,414 путем математического вывода, и невозможно приблизить коэффициент потребления к 1,0.Алгоритм относительно прост, и надежность управления относительно хорошая.
Во втором варианте стратегии управления мы приняли алгоритм ПИД-регулирования, широко используемый в промышленном управлении.
Его принцип алгоритма приближает ошибку управления к 0 через член P (пропорция), член I (интеграл) и член D (разность), что может эффективно решить проблему пропорционального управления. На самом деле алгоритм PID после линии также достиг определенного эффекта контроля затрат, но надежность немного хуже, чем у P-управления, и требуется больше правил, чтобы ограничить его стабильную работу.
об авторе Чжу Тайпэн, руководитель лаборатории OPPO Machine Learning Stargazing Lab 8 лет опыта работы с интернет-алгоритмами.В 2016 году он присоединился к OPPO, чтобы отвечать за алгоритм рекламы информационного потока, а в 2020 году он отвечал за построение рекомендательной/рекламной инфраструктуры машинного обучения.
Получите больше интересного контента: обратите внимание на публичный аккаунт [OPPO Internet Technology]