Проблема холодного старта рекомендательной системы

машинное обучение
Проблема холодного старта рекомендательной системы

Общественный номер: You Er Hut
Автор: Питер
Редактор: Питер

Всем привет, меня зовут Питер~

В этой статье объясняется проблема холодного пуска в рекомендательной системе.Основные справочные материалы:г-н Сян ЛянТретья глава книги «Практика рекомендательной системы» используется только в качестве учебного материала.

Основная цель написания этой статьи в том, что когда было два собеседования, интервьюер задал мне такой вопрос: Петр, ты записал статью про рекомендательные системы, так ты знаешь, как решить холодный старт?

Peter A: Однажды я увидел проблему холодного запуска в книге и забыл о ней!

Что такое холодный пуск?

Рекомендательная система должна предсказывать будущее поведение и интересы пользователя на основе прошлого поведения и интересов пользователя, поэтому большое количество данных о поведении пользователя становится важной предпосылкой для рекомендательной системы.

Для крупных веб-сайтов, таких как Baidu, Google, YouTube и т. д., у них уже есть большой объем пользовательских данных, и они могут давать рекомендации непосредственно на основе этих массивных данных; однако, когда веб-сайт не имеет большого объема пользовательских данных , как разработать систему персонализированных рекомендаций, чтобы пользователи были довольны рекомендуемыми результатами, что является проблемой холодного запуска.

Классификация проблем холодного пуска

Холодный запуск пользователя

Для новых пользователей: холодный старт пользователя в основном решает проблему составления персонализированных рекомендаций для новых пользователей. Когда приходит новый пользователь, нет данных о его историческом поведении, поэтому невозможно делать прогнозы на основе его исторического поведения.

предмет холодный пуск

Для новинок: Основное решение — как рекомендовать новинки пользователям, которым это может быть интересно.

Холодный запуск системы

Для новой системы: она в основном решает проблему разработки системы персонализированных рекомендаций на недавно разработанном веб-сайте (без пользователей, без элементов), чтобы пользователи могли пользоваться службой персонализированных рекомендаций, когда веб-сайт только что выпущен.

Обходной путь холодного запуска

Общее решение для холодного запуска:

  • Предоставление неперсонализированных рекомендаций: популярные рейтинги, списки Top10 и т.д., при сборе данных пользователя в определенном объеме, давать персонализированные рекомендации
  • Используйте регистрационную информацию пользователя: делайте подробные персонализированные рекомендации на основе возраста, пола и другой информации, предоставленной пользователями во время регистрации.
  • Используйте учетную запись пользователя в социальной сети для входа в систему (требуется авторизация пользователя) и давайте рекомендации на основе увлечений друзей пользователя.
  • Требовать, чтобы пользователи оставляли отзыв об элементах при входе в систему, собирали информацию об интересе пользователей к этим элементам, а затем рекомендовали пользователям похожие элементы.
  • Для недавно добавленных элементов используйте информацию о содержимом, чтобы рекомендовать их пользователям, которым понравились или похожие элементы.
  • При холодном запуске системы вводятся знания экспертов и определенным эффективным способом устанавливается корреляционная таблица элементов.

Использовать регистрационную информацию пользователя

В интерфейсе регистрации персонализированной радиостанции необходимо указать личную информацию: день рождения, пол, почтовый индекс и т. д.

Существует три основных типа регистрационной информации пользователя:

  1. Демографические данные: возраст, пол, профессия, этническая принадлежность и т. д.
  2. Описание интереса: описание увлечений пользователя.
  3. Импорт данных о поведении с других веб-сайтов: импорт некоторых данных о поведении пользователей или данных из социальных сетей со сторонних веб-сайтов, таких как Douban и Weibo (требуется согласие пользователя).

Пример рекомендации на основе демографических данных:

Выберите правильный элемент, чтобы активировать интерес пользователя

Это очень распространенная практика: когда пользователь впервые посещает рекомендательную систему, вместо того, чтобы сразу показать пользователю результаты рекомендаций, он предоставляет пользователю какие-то элементы, просит пользователя оставить отзыв по этим элементам, а затем обеспечивает персонализацию на основе отзывов пользователей.рекомендую.

Веб-сайт фильмов Jinni требует, чтобы пользователи оценивали несколько фильмов при входе в систему, чтобы собирать интересы пользователей для холодного запуска.

Предметы, которые можно использовать для активизации интереса пользователя, требуют характеристик:

  • Популярность: дайте пользователям знать, о каких товарах они будут отзываться, чтобы они могли дать точную обратную связь.
  • Репрезентативные и отличительные: элементы, которые активируют интерес пользователей, не могут быть общими и не могут различать пользователей.
  • В наборе элементов запуска должно быть разнообразие: существует множество возможностей для интересов пользователей, и пользователям необходимо предоставить набор элементов с широким охватом, чтобы они могли выбирать из них.

Используйте информацию о содержании элемента

Проблема, решаемая холодным стартом товара, заключается в том, как рекомендовать новые продукты пользователям, которые в них заинтересованы. Общая информация о содержании для общих элементов:

Выступить в роли эксперта

Когда создается много рекомендательных систем, нет ни данных о поведении пользователей, ни достаточной информации о содержании элементов для расчета точного сходства элементов.

Итак, как решить рекомендательную проблему системы? Ответ: Спросите у эксперта. Две репрезентативные системы: персонализированное интернет-радио Pandora и сайт рекомендаций фильмов Jinni.

Pandora – это персонализированное радиоприложение, которое воспроизводит музыку для пользователей. В нем работает группа компьютерных музыкантов, которые размечают музыку в нескольких измерениях. В конце концов, они используют 400 функций (то, что Pandora называет генами). После маркировки каждую песню можно представить в виде 400-мерного вектора.

Jinni также проделала аналогичную работу, разработав собственную генетическую систему фильма и позволив экспертам маркировать фильм.

После экспертной аннотации Jinni также будет использовать технологию машинного обучения для аннотирования фильма, анализируя комментарии пользователей к фильму и атрибуты контента фильма. Jinni решает проблему холодного запуска системы, комбинируя экспертную систему и метод машинного обучения.