Ключевые слова:рекомендательные системы, глубокое обучение, ориентированность на пользователя, воспроизводимость и многозадачность
Конференция Recommender System Conference 2019 (Recsys) состоялась в Копенгагене, Дания, в сентябре этого года.В конференции приняли участие 909 экспертов и ученых со всего мира, что является самой крупной на сегодняшний день. Конференция охватывает темы, связанные с рекомендательными системами, от социального воздействия рекомендательных систем до алгоритмов, используемых для их создания.
В этом году, помимо рассмотрения области «рекомендательных систем» с точки зрения алгоритмов и методов, мы также углубляемся в развитие этой области, обнаруживая и решая проблемы в рекомендательных системах. На встрече также присутствовали социологи. Это напоминает нам о том, что технология рекомендательной системы влияет на нашу жизнь, влияет на взаимодействие людей с информацией и потребление развлечений. Есть поговорка: «С большой силой приходит большая ответственность». Как технические специалисты, мы несем ответственность не только перед нашими пользователями, но и перед коллегами, с которыми мы работаем. В следующих главах мы подробно рассмотрим эти проблемы, а также некоторые алгоритмы и приложения.
влияние общества
Конференция этого года особо подчеркнула комплексность и социальное влияние рекомендательных систем. Первый основной докладчик, Мирей Хильдебрандт, рассказала о том, как GDPR изменил стимулы операторов, т. е. кто может решать, что и как обрабатывают такие люди, как рекламодатели или издатели, чтобы можно было не только оптимизировать с точки зрения прибыли, но и учитывать прозрачность и лучший подход. (Примечание: GDPR, Общий регламент по защите данных, Общий регламент по защите данных, был выпущен Европейским союзом в мае 2018 года для пресечения неправомерного использования личной информации и защиты личной конфиденциальности)
второй основной докладчикEszter Hargittai рассказывает об онлайн-поведении людей, различиях в онлайн-поведении людей на разных платформах и о том, как онлайн-поведение людей может привести к предвзятым алгоритмам. Наконец, группа обсудила, как создавать социально ответственные рекомендательные системы.
Воспроизводимость и улучшение
Воспроизводимость уже давно является важной темой, которая в настоящее время преследует область рекомендательных систем. Однако сделать фрагмент кода доступным для всех недостаточно, фундаментальная проблема, которую необходимо решить, заключается в том, как проводить эксперименты и как измерять качество улучшения: базовый уровень иногда недостаточно корректируется, выбор набор данных и иногда ставится задача. Он также недостаточно строг, а тестирование улучшений иногда не имеет смысла.
A Worrying Analysis of Recent Neural Recommendation ApproachesВ этой статье сравниваются несколько более сложных нейронных вариантов CF, воспроизводятся результаты, представленные этими методами, и превосходят другие настроенные простые базовые показатели. Эта статья была признана «Лучшей статьей», что посылает сигнал о том, что нам все еще нужно больше инвестировать в эту область и нам нужно больше работать.
Многоцелевая/многозадачная оптимизация
Использование рекомендательных систем обычно включает в себя несколько целей, и для решения этой проблемы проблема может быть сформулирована в многозадачной постановке.
оптимизация
Все больше и больше рекомендательных систем ищут способы оптимизации для нескольких целей. Например, оптимизировать не только количество просмотров видео, но и количество лайков и комментариев к видео. Для этого в системе будет несколько функций потерь, по одной для каждой цели. В какой-то необходимый момент нам нужно объединить эти потери в одну, поэтому нужно присвоить каждой потере вес. Например,
Просмотры видео могут быть в два раза важнее комментариев пользователей к видео. Ручная установка этих весов не оптимальна и не обременительна при работе со многими задачами. Еще одна статья номинирована на «Лучшую статью».A Pareto-Efficient Algorithm for Multiple Objective Optimization in E-Commerce Recommendation(«Алгоритм эффективности Парето для многокритериальной оптимизации в рекомендациях электронной коммерции», примечание переводчика), вводит метод автоматического расчета весов, чтобы изменить состояние определенного веса за счет определенной цели (статус эффективности Парето). , ни одна цель не может быть улучшена без ущерба для других целей). Для достижения оптимальной по Парето эффективности обычно делают так:
• Эволюционная эвристика: Парето-эффективность не гарантируется.
• Метод скаляризации: объединяет все цели в одну цель, взвешенную сумму потерь. Обычно скалярные веса определяются вручную.
• В этой статье авторы рассматривают скалярные методы и предлагают двухэтапный алгоритм для изучения скалярных весов с теоретическими гарантиями. Шаг обновления весов эквивалентен решению квадратичной задачи с ограничениями.
Архитектура
Google опубликовал две статьи, демонстрирующие многоцелевую архитектуру поиска и ранжирования видео. Один из них является:Recommending what video to watch next: a multitask ranking system. В этом посте предлагается использовать сложную структуру для обработки сложных взаимодействий, чтобы узнать, как рекомендовать видео:
• Несколько целей: участие, удовлетворение
• Несколько вставок: изображения, текст
• Используйте сочетание экспертных моделей с несколькими входами для достижения вышеуказанного.
Два курса, которые были запущены позже, до сих пор вращаются вокруг этой темы, и к ней есть большой интерес.
Обучение на неявной обратной связи
Рекомендательные системы обычно не измеряют удовлетворенность пользователей напрямую, а основываются на неявных сигналах обратной связи (таких как клики, просмотры и т. д.). Во многих работах предлагаются способы более эффективного использования неявной обратной связи.
Relaxed Softmax for PU LearningМы предлагаем новый подход к работе с отрицательной выборкой, обычным шагом в немаркированном обучении (обучение на основе неявной обратной связи тесно связано с этой задачей), и большинство методов предполагают отрицательную выборку из твердотельного распределения. В этой статье мы предлагаем новую схему отрицательной выборки, основанную на распределении Больцмана, где отрицательная выборка выбирается ближе к границе решения алгоритма, что позволяет предоставить больше информации.
Leveraging Post-click Feedback for Content RecommendationsВ этой статье рассматривается проблема обратной связи после клика. Они сосредоточились на реальных наборах музыкальных и видеоданных с информацией после клика (т. е. была ли песня прослушана или пропущена) и продемонстрировали улучшение AUC в двухточечной и парной моделях (18,3% и 2,5%, соответственно).
Авторы предлагают общую вероятностную структуру для слияния трех непересекающихся наборов наблюдений: завершение клика, клик и пропуск или отсутствие клика. Достоверность для каждого типа обратной связи моделируется дисперсией распределения Гаусса с последующей оценкой максимального правдоподобия.
В медийной рекламе распределение признаков может быть не фиксированным, и модель, предсказывающая клики, нуждается в регулярном обновлении. Одной из проблем является отсутствие немедленного доступа к актуальным отзывам пользователей. существуетAddressing Delayed Feedback for Continuous Training with Neural Networks in CTR predictionВ данной работе авторы обращаются к проблеме запаздывающей обратной связи.
В родственной работе используемые потери представляют собой потери с задержкой обратной связи (при условии, что для определения задержки обратной связи используется отдельная модель) и потери PU (все отрицательные выборки в смещенных данных рассматриваются как немаркированные). Авторы предлагают две функции потерь, которые приводят к наилучшей производительности в автономном режиме и приводят к выигрышу в онлайн-режиме для конкретной модели:
• Взвешивание FN на основе выборки важности (FN weighted). Сначала образцы были помечены как отрицательные, а положительная метка отображалась сразу после взаимодействия с пользователем.
• Калибровка ЧШ (FN calibration)Калиброванная версия потери
В случаях, когда обратная связь однозначна (например, при покупке), пользователь может уже приобрести товар даже без рекомендации. Подъем (также известный как дельта) определяется здесь как увеличение количества действий пользователя, вызванных рекомендацией.Uplift-based Evaluation and Optimization of RecommendersВ этой статье предлагается новый протокол автономной оценки и метод оптимизации для рекомендации на основе повышения.
From Preference into Decision Making: Modeling User Interactions in Recommender SystemsВ этой статье представлена RNN на уровне страницы, которая не только рассматривает каждый элемент и операцию независимо, но также решает проблемы взаимного влияния нескольких элементов на странице, множества различных операций и разных типов операций.
Рекомендации на основе контента
Контент-ориентированный подход позволяет решить проблему холодного старта: некоторые элементы имеют мало просмотров, а некоторые совершенно новые.
CB2CF: A Neural Multiview Content-to-Collaborative Filtering Model for Completely Cold Item Recommendations Исправьте это, создав вложения CF, которые содержат только:
• Категориальные характеристики
• Непрерывные функции
• вложения слов
Затем используйте простую CNN, чтобы сопоставить вышеуказанные функции с вложениями CF. Результаты показывают, что CB2CF уступает CF, но лучше, чем только CB, и решает проблему холодного пуска.
HybridSVD: When Collaborative Information is Not EnoughМы предлагаем подход к внедрению продуктов и пользователей путем расширения традиционных методов на основе SVD с использованием синергетической информации и сходства на основе контента. Основная идея состоит в том, чтобы параметризовать матрицу помощи пользователю или аналогичные термины, построенные из содержимого, что приводит к билинейной форме, заменяя термины скалярного произведения в матрице Грама в таблице взаимодействия.
ПрименятьПробная версия продукта, добро пожаловать, чтобы добавить учетную запись WeChat первого рекомендательного помощника (ID: recsysfc).
Этот аккаунтИнтеллектуальные рекомендации четвертой парадигмы Продукты Первая рекомендацияофициальный аккаунт. Аккаунт основан на компьютерной сфере, особенно на передовых исследованиях, связанных с искусственным интеллектом. Он направлен на то, чтобы поделиться с общественностью большим количеством знаний, связанных с искусственным интеллектом, и способствовать пониманию общественностью искусственного интеллекта с профессиональной точки зрения. Предоставить открытую платформу. для обсуждения, общения и обучения, чтобы каждый мог как можно скорее насладиться ценностью, созданной искусственным интеллектом.
Связанное чтение:
Концепции и показатели для оценки системы рекомендаций
Рабочий процесс системы рекомендаций
Хотите узнать о рекомендательных системах? Смотри сюда! (2) - Метод нейронной сети
Как AutoML реализует автоматический онлайн и O&M интеллектуальной системы рекомендаций?
Начало работы с рекомендательными системами, список знаний, которые вы не должны пропустить