RecSys 2019: Что обсуждали на конференции? (с загрузкой бумаги)

искусственный интеллект

Ключевые слова:рекомендательные системы, глубокое обучение, ориентированность на пользователя, воспроизводимость и многозадачность

Конференция Recommender System Conference 2019 (Recsys) состоялась в Копенгагене, Дания, в сентябре этого года.В конференции приняли участие 909 экспертов и ученых со всего мира, что является самой крупной на сегодняшний день. Конференция охватывает темы, связанные с рекомендательными системами, от социального воздействия рекомендательных систем до алгоритмов, используемых для их создания.

В этом году, помимо рассмотрения области «рекомендательных систем» с точки зрения алгоритмов и методов, мы также углубляемся в развитие этой области, обнаруживая и решая проблемы в рекомендательных системах. На встрече также присутствовали социологи. Это напоминает нам о том, что технология рекомендательной системы влияет на нашу жизнь, влияет на взаимодействие людей с информацией и потребление развлечений. Есть поговорка: «С большой силой приходит большая ответственность». Как технические специалисты, мы несем ответственность не только перед нашими пользователями, но и перед коллегами, с которыми мы работаем. В следующих главах мы подробно рассмотрим эти проблемы, а также некоторые алгоритмы и приложения.

влияние общества

Конференция этого года особо подчеркнула комплексность и социальное влияние рекомендательных систем. Первый основной докладчик, Мирей Хильдебрандт, рассказала о том, как GDPR изменил стимулы операторов, т. е. кто может решать, что и как обрабатывают такие люди, как рекламодатели или издатели, чтобы можно было не только оптимизировать с точки зрения прибыли, но и учитывать прозрачность и лучший подход. (Примечание: GDPR, Общий регламент по защите данных, Общий регламент по защите данных, был выпущен Европейским союзом в мае 2018 года для пресечения неправомерного использования личной информации и защиты личной конфиденциальности)

второй основной докладчикEszter Hargittai рассказывает об онлайн-поведении людей, различиях в онлайн-поведении людей на разных платформах и о том, как онлайн-поведение людей может привести к предвзятым алгоритмам. Наконец, группа обсудила, как создавать социально ответственные рекомендательные системы.

Воспроизводимость и улучшение

Воспроизводимость уже давно является важной темой, которая в настоящее время преследует область рекомендательных систем. Однако сделать фрагмент кода доступным для всех недостаточно, фундаментальная проблема, которую необходимо решить, заключается в том, как проводить эксперименты и как измерять качество улучшения: базовый уровень иногда недостаточно корректируется, выбор набор данных и иногда ставится задача. Он также недостаточно строг, а тестирование улучшений иногда не имеет смысла.

A Worrying Analysis of Recent Neural Recommendation ApproachesВ этой статье сравниваются несколько более сложных нейронных вариантов CF, воспроизводятся результаты, представленные этими методами, и превосходят другие настроенные простые базовые показатели. Эта статья была признана «Лучшей статьей», что посылает сигнал о том, что нам все еще нужно больше инвестировать в эту область и нам нужно больше работать.

Многоцелевая/многозадачная оптимизация

Использование рекомендательных систем обычно включает в себя несколько целей, и для решения этой проблемы проблема может быть сформулирована в многозадачной постановке.

оптимизация

Все больше и больше рекомендательных систем ищут способы оптимизации для нескольких целей. Например, оптимизировать не только количество просмотров видео, но и количество лайков и комментариев к видео. Для этого в системе будет несколько функций потерь, по одной для каждой цели. В какой-то необходимый момент нам нужно объединить эти потери в одну, поэтому нужно присвоить каждой потере вес. Например,

Просмотры видео могут быть в два раза важнее комментариев пользователей к видео. Ручная установка этих весов не оптимальна и не обременительна при работе со многими задачами. Еще одна статья номинирована на «Лучшую статью».A Pareto-Efficient Algorithm for Multiple Objective Optimization in E-Commerce Recommendation(«Алгоритм эффективности Парето для многокритериальной оптимизации в рекомендациях электронной коммерции», примечание переводчика), вводит метод автоматического расчета весов, чтобы изменить состояние определенного веса за счет определенной цели (статус эффективности Парето). , ни одна цель не может быть улучшена без ущерба для других целей). Для достижения оптимальной по Парето эффективности обычно делают так:

• Эволюционная эвристика: Парето-эффективность не гарантируется.

• Метод скаляризации: объединяет все цели в одну цель, взвешенную сумму потерь. Обычно скалярные веса определяются вручную.

• В этой статье авторы рассматривают скалярные методы и предлагают двухэтапный алгоритм для изучения скалярных весов с теоретическими гарантиями. Шаг обновления весов эквивалентен решению квадратичной задачи с ограничениями.

Архитектура

Google опубликовал две статьи, демонстрирующие многоцелевую архитектуру поиска и ранжирования видео. Один из них является:Recommending what video to watch next: a multitask ranking system. В этом посте предлагается использовать сложную структуру для обработки сложных взаимодействий, чтобы узнать, как рекомендовать видео:

• Несколько целей: участие, удовлетворение

• Несколько вставок: изображения, текст

• Используйте сочетание экспертных моделей с несколькими входами для достижения вышеуказанного.

Два курса, которые были запущены позже, до сих пор вращаются вокруг этой темы, и к ней есть большой интерес.

Обучение на неявной обратной связи

Рекомендательные системы обычно не измеряют удовлетворенность пользователей напрямую, а основываются на неявных сигналах обратной связи (таких как клики, просмотры и т. д.). Во многих работах предлагаются способы более эффективного использования неявной обратной связи.

Relaxed Softmax for PU LearningМы предлагаем новый подход к работе с отрицательной выборкой, обычным шагом в немаркированном обучении (обучение на основе неявной обратной связи тесно связано с этой задачей), и большинство методов предполагают отрицательную выборку из твердотельного распределения. В этой статье мы предлагаем новую схему отрицательной выборки, основанную на распределении Больцмана, где отрицательная выборка выбирается ближе к границе решения алгоритма, что позволяет предоставить больше информации.

Leveraging Post-click Feedback for Content RecommendationsВ этой статье рассматривается проблема обратной связи после клика. Они сосредоточились на реальных наборах музыкальных и видеоданных с информацией после клика (т. е. была ли песня прослушана или пропущена) и продемонстрировали улучшение AUC в двухточечной и парной моделях (18,3% и 2,5%, соответственно).

Авторы предлагают общую вероятностную структуру для слияния трех непересекающихся наборов наблюдений: завершение клика, клик и пропуск или отсутствие клика. Достоверность для каждого типа обратной связи моделируется дисперсией распределения Гаусса с последующей оценкой максимального правдоподобия.

В медийной рекламе распределение признаков может быть не фиксированным, и модель, предсказывающая клики, нуждается в регулярном обновлении. Одной из проблем является отсутствие немедленного доступа к актуальным отзывам пользователей. существуетAddressing Delayed Feedback for Continuous Training with Neural Networks in CTR predictionВ данной работе авторы обращаются к проблеме запаздывающей обратной связи.

В родственной работе используемые потери представляют собой потери с задержкой обратной связи (при условии, что для определения задержки обратной связи используется отдельная модель) и потери PU (все отрицательные выборки в смещенных данных рассматриваются как немаркированные). Авторы предлагают две функции потерь, которые приводят к наилучшей производительности в автономном режиме и приводят к выигрышу в онлайн-режиме для конкретной модели:

• Взвешивание FN на основе выборки важности (FN weighted). Сначала образцы были помечены как отрицательные, а положительная метка отображалась сразу после взаимодействия с пользователем.

• Калибровка ЧШ (FN calibration)Калиброванная версия потери

В случаях, когда обратная связь однозначна (например, при покупке), пользователь может уже приобрести товар даже без рекомендации. Подъем (также известный как дельта) определяется здесь как увеличение количества действий пользователя, вызванных рекомендацией.Uplift-based Evaluation and Optimization of RecommendersВ этой статье предлагается новый протокол автономной оценки и метод оптимизации для рекомендации на основе повышения.

From Preference into Decision Making: Modeling User Interactions in Recommender SystemsВ этой статье представлена ​​RNN на уровне страницы, которая не только рассматривает каждый элемент и операцию независимо, но также решает проблемы взаимного влияния нескольких элементов на странице, множества различных операций и разных типов операций.

Рекомендации на основе контента

Контент-ориентированный подход позволяет решить проблему холодного старта: некоторые элементы имеют мало просмотров, а некоторые совершенно новые.

CB2CF: A Neural Multiview Content-to-Collaborative Filtering Model for Completely Cold Item Recommendations Исправьте это, создав вложения CF, которые содержат только:

• Категориальные характеристики

• Непрерывные функции

• вложения слов

Затем используйте простую CNN, чтобы сопоставить вышеуказанные функции с вложениями CF. Результаты показывают, что CB2CF уступает CF, но лучше, чем только CB, и решает проблему холодного пуска.

HybridSVD: When Collaborative Information is Not EnoughМы предлагаем подход к внедрению продуктов и пользователей путем расширения традиционных методов на основе SVD с использованием синергетической информации и сходства на основе контента. Основная идея состоит в том, чтобы параметризовать матрицу помощи пользователю или аналогичные термины, построенные из содержимого, что приводит к билинейной форме, заменяя термины скалярного произведения в матрице Грама в таблице взаимодействия.

ПрименятьПробная версия продукта, добро пожаловать, чтобы добавить учетную запись WeChat первого рекомендательного помощника (ID: recsysfc).

Этот аккаунтИнтеллектуальные рекомендации четвертой парадигмы Продукты Первая рекомендацияофициальный аккаунт. Аккаунт основан на компьютерной сфере, особенно на передовых исследованиях, связанных с искусственным интеллектом. Он направлен на то, чтобы поделиться с общественностью большим количеством знаний, связанных с искусственным интеллектом, и способствовать пониманию общественностью искусственного интеллекта с профессиональной точки зрения. Предоставить открытую платформу. для обсуждения, общения и обучения, чтобы каждый мог как можно скорее насладиться ценностью, созданной искусственным интеллектом.

Связанное чтение:

Концепции и показатели для оценки системы рекомендаций

Рабочий процесс системы рекомендаций

Народная система рекомендаций

Хотите узнать о рекомендательных системах? Смотри сюда! (2) - Метод нейронной сети

Хотите узнать о рекомендательных системах? Смотри сюда! (1) - Совместная фильтрация и разложение по единичным значениям

Как AutoML реализует автоматический онлайн и O&M интеллектуальной системы рекомендаций?

Начало работы с рекомендательными системами, список знаний, которые вы не должны пропустить