[Документальное исследование] Предвзятость популярности в динамических рекомендациях

алгоритм

Оригинальная ссылка

Введение

Предвзятость популярности — давняя проблема рекомендательных систем:Предметы с высокой популярностью рекомендуются чрезмерно, в то время как менее популярные предметы, которые могут заинтересовать пользователей, рекомендуются недостаточно., эта предвзятость оказывает пагубное влияние как на потребителей, так и на продавцов, и многие исследования были посвящены борьбе с этой предвзятостью.

Большинство существующих исследований, как правило, применяют предвзятость популярности к статическим параметрам, то есть: модели рекомендаций обучаются на офлайн-наборах данных, а затем проводится один раунд рекомендаций для анализа предвзятости популярности. Хотя эти исследования подчеркивают распространенность предвзятости популярности, в статье утверждается, что предвзятость может быть динамической, включая факторы, влияющие на предвзятость популярности и ее эволюцию, а также эффективность методов смягчения этой предвзятости при реалистичных предположениях об эволюции системы секса. Таким образом, в этой статье предлагается основа для исследования предвзятости популярности в динамических рекомендациях.

Динамическую рекомендацию можно рассматривать как замкнутый цикл, как показано на рисунке 1. Пользователи взаимодействуют с системой посредством ряда действий (таких как щелчок, просмотр, оценка); затем данные отзывов пользователей используются для обучения модели рекомендаций; обученная модель используется для рекомендации новых продуктов пользователю; затем постоянно запускается новый цикл.

image.png

Хотя существует множество факторов, которые могут повлиять на этот динамический процесс рекомендаций, авторы выделяют четыре ключевых фактора, которые могут повлиять на предвзятость популярности и ее эволюцию:

  • Врожденный дисбаланс размера аудитории: пользователи могут предпочесть определенные элементы (даже в модели непредвзятых случайных рекомендаций), что означает, что несколько элементов могут иметь очень большой размер пользователя, в то время как большинство элементов имеют небольшой размер пользователя.
  • предвзятость модели: сама модель рекомендаций может усилить любой дисбаланс в наборе данных, который она использует для обучения.
  • смещение позиции: на основе рекомендаций, данных моделью, пользователи с большей вероятностью будут просматривать элементы с самым высоким рейтингом.
  • замкнутый контур обратной связи: данные обратной связи, собранные из текущей модели рекомендаций, повлияют на обучение будущих моделей из-за повторяющихся циклов, потенциально накапливающих систематическую ошибку.

В данной работе представленпредвзятость популярности-возможности, которая представляет собой формализованную формулировку предвзятости популярности, основанную на концепции равных возможностей. Традиционная предвзятость популярности основана наСтатистическое среднее, т. е.: сравнить количество рекомендованных раз среди популярных и непопулярных товаров. в то время как систематическая ошибка распространенности-шансаИзмеряет, кликают ли популярные и непопулярные элементы (или другие показатели) пропорционально их истинному размеру аудитории., сравнивая уровни вовлеченности, а не просто подсчеты рекомендательных систем, можно добиться предвзятости популярности-шанса, напрямую связанной с удовлетворенностью пользователей и экономической выгодой для поставщиков товаров.

В статье есть три основных вклада:

  1. Во-первых, всестороннее эмпирическое исследование предвзятости популярности в динамических рекомендациях проводится с помощью экспериментов с моделированием, исследуя эволюцию предвзятости популярности в динамических рекомендациях и влияние этих четырех факторов на предвзятость популярности. В статье показано, что врожденный дисбаланс размера аудитории и предвзятость модели являются основными факторами предвзятости популярности, которая еще больше усугубляется предвзятостью местоположения и замкнутой обратной связью. Кроме того, в статье сравниваются две разные стратегии отрицательной выборки, чтобы проиллюстрировать, что влияние предвзятости популярности можно смягчить путем тщательного планирования отрицательной выборки.

  2. Во-вторых, мы изучаем, как устранить предвзятость популярности в динамических рекомендациях. В этой статье будет показано, как адаптировать метод устранения смещения, предложенный в статической среде, к динамическим сценам, а также предложен независимый от модели метод устранения смещения с ложной положительной коррекцией (FPC), который можно комбинировать с другими методами устранения смещения для дальнейшего повышения производительности.

  3. Наконец, обширные эксперименты показывают эффективность предложенного метода динамического устранения смещения по сравнению со статическими стратегиями, а также иллюстрируют значительное улучшение производительности, обеспечиваемое методом FPC.

постановка проблемы

Формализация динамических рекомендаций

Если предположить, что существует онлайн-платформа, которая предоставляет рекомендации, такие как рекомендации фильмов, вакансий или песен, процесс динамической рекомендации в ней выглядит следующим образом:

  1. Каждый раз, когда пользователь посещает платформу, платформа будет предоставлять ранжированный список продуктов на основе модели персонализированных рекомендаций, полученной из исторических отзывов пользователя.
  2. Регулярно обновляйте модель персонализированных рекомендаций с помощью вновь собранной информации об отзывах пользователей. Чтобы направлять нового пользователя (холодный старт), платформа будет использовать некоторые неперсонализированные методы, чтобы понять предпочтения пользователя, такие как случайный показ пользователю некоторых элементов и сбор отзывов.

Подводя итог, предположим, что в системе есть набор пользователейU={1,2,..,N}U=\{1,2,..,N\}, и набор предметовI={1,2,...,M}I=\{1,2,...,M\}. У каждого пользователя есть набор предметов, которые ему нравятся (дляIIподмножество), как элементiiОбщее количество пользователей можно определить какiiразмер аудитории,использоватьAiA_iВыражать.

На этапе повышения система случайным образом рекомендуетKKпродукты, чтобы направлять пользователей для сбора кликов пользователя по продуктуDD. По исходным даннымDD, получить первую рекомендательную модельΨ\Psi, например, можно обучить модель матричной факторизации (МФ). Когда пользователи входят в систему один за другим, система использует последнюю модель, чтобы рекомендовать??Рейтинг продуктов и сбор новых кликов пользователей по продуктам. КаждыйLLПосле того, как каждый пользователь закончит посещение, система переобучит модель на основе всех собранных кликов, и весь процесс показан в Алгоритме 1.

image.png

Предвзятость популярности формализована

Предвзятость популярности-шанса вводится для формализации предвзятости популярности на каждой итерации процесса динамической рекомендации.ttЧтобы скорректировать предвзятость, нам сначала нужно рассчитать его истинную положительную скорость для каждого элемента. Гипотетические товарыiiв итеративном циклеttклики вCitC^t_i,ноiiИстинный положительный показательTPRi=Cit/AiTPR_i=C^t_i/A_i. После этого итерация измеряется коэффициентом Джини.ttСтепень неравенства истинно положительных показателей, связанных с популярностью товара в:

Ginit=iеI(2iM1)TPRiMiеITPRiGini_t=\frac{\sum_{i\in I}(2i-M-1)TPR_i}{M\sum_{i\in I}TPR_i}

Среди них товары располагаются в порядке неубывания от 1 до М по размеру аудитории, то естьAiA(i+1)A_i \leq A_{(i+1)}. использоватьGinitе[1,1]Gini_t\in [-1,1]Чтобы количественно оценить предвзятость популярности, меньшее абсолютное значение индекса Джини указывает на меньшую предвзятость.Ginit>0|Gini_t>0|указывает на то, что истинный положительный показатель положительно коррелирует с размером аудитории продукта,Ginit<0|Gini_t<0|Указывает на отрицательную корреляцию (т. е. обратное смещение популярности).

Факторы, влияющие на предвзятость популярности

Как показано на рисунке 1, необходимо сосредоточиться на четырех основных факторах:

Врожденный дисбаланс размера аудитории

Разные продукты имеют разный размер аудитории, и этот дисбаланс может привести к искажению популярности. Например, размер аудитории продуктов обычно следует распределению с длинным хвостом, то есть размер аудитории небольшого количества продуктов очень велик, а размер аудитории большинства продуктов мал. Это приводит к естественному дисбалансу в данных о привязанности пользователей (таких как клики и т. д.) даже в случае полностью случайных рекомендаций.

предвзятость модели

В случае, когда пользователям могут понравиться два продукта одинаково, рекомендательная модель также имеет тенденцию ранжировать продукты с большим количеством кликов, чем с меньшим количеством кликов в данных обучения.Это общий алгоритм, основанный на совместной фильтрации.Недостатки, если данные обучения не сбалансирован, напрямую приведет к предвзятости популярности.

предвзятость местоположения

В сценарии сортировки обычным явлением является то, что элементы с более высокими позициями просматриваются с большей вероятностью, чем элементы с более низкими позициями. Если есть также врожденный дисбаланс размера аудитории и предвзятость модели, позиционные предубеждения могут усугубить предвзятость популярности.

обратная связь с обратной связью

Будущие модели обучаются на основе данных о кликах из предыдущих моделей и рекомендательных систем.Таким образом, предвзятость популярности, созданная в прошлом, накапливается, а в последующих моделях генерируется больше по мере продолжения цикла обратной связи.

экспериментальное обучение

В этом разделе проводится эмпирическое исследование того, как предвзятость популярности развивается в динамических рекомендациях, включая влияние четырех факторов, обсуждавшихся ранее, на предвзятость, а также путем сравнения двух различных стратегий отрицательной выборки, чтобы проиллюстрировать, как тщательный дизайн отрицательной выборки может смягчить влияние популярности. предвзятость.

настраивать

Эксперимент столкнулся с двумя ключевыми проблемами:

  1. Как получить полную правду о корреляциях между пользователем и элементом?
  2. Как имитировать поведение кликов пользователя, чтобы давать предложения?

Для первой задачи, создания полусинтетических данных из реального набора данных взаимодействия пользователя с элементом, мы использовалиML1MиCiaoнаборов данных, 1000 пользователей в каждом наборе данных были зарезервированы случайным образом. После этого используется модель матричной факторизации (MF), чтобы дополнить исходный набор данных, чтобы обеспечить наземные корреляции между пользователем и элементом. Путем изменения процесса генерации данных для каждого базового набора данных также были созданы 4 переменные с различными уровнями дисбаланса размера внутренней аудитории для изучения влияния дисбаланса размера внутренней аудитории.

Затем были проведены имитационные эксперименты на основе процедуры Алгоритма 1, гдеK=20,T=40000,L=50K=20,T=40000,L=50.

Для второй задачи, основанной на позиционном уклонеδk=1/log2(1+k)\delta_k=1/log_2(1+k)моделировать поведение пользователей при кликах, чтобы идентифицировать пользователейuuНужно ли нажимать, чтобы просмотреть местоположениеkkтовары вii.

Кроме того, специальной операцией является:Отрицательные образцы взяты из элементов, которые рекомендуются каждому пользователю, но на которые он не нажимал., этот метод может обеспечить более высокую полезность рекомендаций и более низкую предвзятость популярности, чем традиционная стратегия отрицательной выборки (выборка отрицательных выборок из всех элементов, по которым не было кликов).

Способы смягчить предвзятость

В статье на основе эмпирических исследований показано, что предвзятость модели и присущая дисбаланс размера аудитории являются двумя наиболее важными факторами, влияющими на популярные рекомендации.Среди них на предвзятость модели могут напрямую влиять операторы (исследователи), а остальные три фактора существуют в системе. Внутренний аспект. С помощью экспериментов было обнаружено, что если устранить погрешность модели, погрешность популярности по-прежнему будет очень низкой даже с учетом влияния трех других факторов. Поэтому в этом разделе мы сосредоточимся на том, как смягчить предвзятость популярности в динамических рекомендациях за счет уменьшения предвзятости модели.

Уменьшение предвзятости модели за счет динамики

Основное внимание в этом разделе уделяется тому, как применять существующие статические методы устранения смещения к динамическим сценариям.Основная идея заключается в постепенном увеличении веса силы устранения смещения в существующих моделях.

Большая часть существующей работы направлена ​​на уменьшение предвзятости популярности в статических сценах за счет уменьшения предвзятости модели. Например, метод под названием «Масштаб» снижает погрешность за счет изменения масштаба выходных данных модели рекомендаций. В частности, для пары пользователь-элемент(u,i)(u,i)Его показатель масштабирования:

r^u,iscaled=r^u,imodel/(Ci)α\hat{r}^{scaled}_{u,i}=\hat{r}^{model}_{u,i}/(C_i)^\alpha

в,r^u,imodel\hat{r}^{model}_{u,i}- оценка прогноза, выводимая рекомендательной моделью,CiC_iколичество кликов по элементу в обучающем наборе данных,α\alpha— это гиперпараметр, используемый для управления силой устранения смещения, чем выше значение, тем выше сила.

В статической рекомендацииα\alphaКак константа, эта настройка явно невозможна в динамических рекомендациях, поэтому в статье предполагается, что с процессом модели динамических рекомендацийα\alphaПостепенно увеличивайте от 0, и размер шага увеличения установлен наΔ\Delta. В частности, из00старт, каждая итерация даетα\alphaувеличиватьΔ\Delta.

Использовать ложноположительную коррекцию

В документе также предлагается независимый от модели метод коррекции ложных срабатываний для устранения смещения, сокращенноFPC, который вероятностно корректирует оценки прогноза на основе ложных положительных сигналов. (Положительный сигнал в тексте относится к рейтингу кликов, а ложноположительный сигнал относится к продукту, который рекомендуется, но не нажимается)

Предположим, вы хотите предсказать пользователейuuи товарыiiкорреляция междуr^u,i\hat{r}_{u,i}, теперь есть оценки прогноза, полученные по рекомендательной моделиr^u,imodel\hat{r}^{model}_{u,i}. Гипотетические товарыiiбыло рекомендовано пользователямuuохватыватьFFраз, но ни разу не кликнули, для каждого реферала было записано как{k1,...,kF}\{k_1,...,k_F\}, ложноположительный сигнал определяется как{ck1=0,...,ckF=0}\{c_{k1}=0,...,c_{kF}=0\}. далее определить пользователяuuнравится продуктiiВероятностьθu,i\theta_{u,i},ноP(ru,i=1)=θu,iP(r_{u,i}=1)=\theta_{u,i}. Изменить рейтингkkВероятность того, что товар будет просмотрен, равнаδk\delta_k,СейчасP(ek=1)=δkP(e_k=1)=\delta_k. Таким образом, учитывая ложноположительный сигнал, можно рассчитатьuuкакiiУсловная вероятность:image.png