Общественный номер: You Er Hut
Автор: Питер
Редактор: Питер
Всем привет, меня зовут Питер~
В этой статье объясняется проблема холодного пуска в рекомендательной системе.Основные справочные материалы:г-н Сян ЛянТретья глава книги «Практика рекомендательной системы» используется только в качестве учебного материала.
Основная цель написания этой статьи в том, что когда было два собеседования, интервьюер задал мне такой вопрос: Петр, ты записал статью про рекомендательные системы, так ты знаешь, как решить холодный старт?
Peter A: Однажды я увидел проблему холодного запуска в книге и забыл о ней!
Что такое холодный пуск?
Рекомендательная система должна предсказывать будущее поведение и интересы пользователя на основе прошлого поведения и интересов пользователя, поэтому большое количество данных о поведении пользователя становится важной предпосылкой для рекомендательной системы.
Для крупных веб-сайтов, таких как Baidu, Google, YouTube и т. д., у них уже есть большой объем пользовательских данных, и они могут давать рекомендации непосредственно на основе этих массивных данных; однако, когда веб-сайт не имеет большого объема пользовательских данных , как разработать систему персонализированных рекомендаций, чтобы пользователи были довольны рекомендуемыми результатами, что является проблемой холодного запуска.
Классификация проблем холодного пуска
Холодный запуск пользователя
Для новых пользователей: холодный старт пользователя в основном решает проблему составления персонализированных рекомендаций для новых пользователей. Когда приходит новый пользователь, нет данных о его историческом поведении, поэтому невозможно делать прогнозы на основе его исторического поведения.
предмет холодный пуск
Для новинок: Основное решение — как рекомендовать новинки пользователям, которым это может быть интересно.
Холодный запуск системы
Для новой системы: она в основном решает проблему разработки системы персонализированных рекомендаций на недавно разработанном веб-сайте (без пользователей, без элементов), чтобы пользователи могли пользоваться службой персонализированных рекомендаций, когда веб-сайт только что выпущен.
Обходной путь холодного запуска
Общее решение для холодного запуска:
- Предоставление неперсонализированных рекомендаций: популярные рейтинги, списки Top10 и т.д., при сборе данных пользователя в определенном объеме, давать персонализированные рекомендации
- Используйте регистрационную информацию пользователя: делайте подробные персонализированные рекомендации на основе возраста, пола и другой информации, предоставленной пользователями во время регистрации.
- Используйте учетную запись пользователя в социальной сети для входа в систему (требуется авторизация пользователя) и давайте рекомендации на основе увлечений друзей пользователя.
- Требовать, чтобы пользователи оставляли отзыв об элементах при входе в систему, собирали информацию об интересе пользователей к этим элементам, а затем рекомендовали пользователям похожие элементы.
- Для недавно добавленных элементов используйте информацию о содержимом, чтобы рекомендовать их пользователям, которым понравились или похожие элементы.
- При холодном запуске системы вводятся знания экспертов и определенным эффективным способом устанавливается корреляционная таблица элементов.
Использовать регистрационную информацию пользователя
В интерфейсе регистрации персонализированной радиостанции необходимо указать личную информацию: день рождения, пол, почтовый индекс и т. д.
Существует три основных типа регистрационной информации пользователя:
- Демографические данные: возраст, пол, профессия, этническая принадлежность и т. д.
- Описание интереса: описание увлечений пользователя.
- Импорт данных о поведении с других веб-сайтов: импорт некоторых данных о поведении пользователей или данных из социальных сетей со сторонних веб-сайтов, таких как Douban и Weibo (требуется согласие пользователя).
Пример рекомендации на основе демографических данных:
Выберите правильный элемент, чтобы активировать интерес пользователя
Это очень распространенная практика: когда пользователь впервые посещает рекомендательную систему, вместо того, чтобы сразу показать пользователю результаты рекомендаций, он предоставляет пользователю какие-то элементы, просит пользователя оставить отзыв по этим элементам, а затем обеспечивает персонализацию на основе отзывов пользователей.рекомендую.
Веб-сайт фильмов Jinni требует, чтобы пользователи оценивали несколько фильмов при входе в систему, чтобы собирать интересы пользователей для холодного запуска.
Предметы, которые можно использовать для активизации интереса пользователя, требуют характеристик:
- Популярность: дайте пользователям знать, о каких товарах они будут отзываться, чтобы они могли дать точную обратную связь.
- Репрезентативные и отличительные: элементы, которые активируют интерес пользователей, не могут быть общими и не могут различать пользователей.
- В наборе элементов запуска должно быть разнообразие: существует множество возможностей для интересов пользователей, и пользователям необходимо предоставить набор элементов с широким охватом, чтобы они могли выбирать из них.
Используйте информацию о содержании элемента
Проблема, решаемая холодным стартом товара, заключается в том, как рекомендовать новые продукты пользователям, которые в них заинтересованы. Общая информация о содержании для общих элементов:
Выступить в роли эксперта
Когда создается много рекомендательных систем, нет ни данных о поведении пользователей, ни достаточной информации о содержании элементов для расчета точного сходства элементов.
Итак, как решить рекомендательную проблему системы? Ответ: Спросите у эксперта. Две репрезентативные системы: персонализированное интернет-радио Pandora и сайт рекомендаций фильмов Jinni.
Pandora – это персонализированное радиоприложение, которое воспроизводит музыку для пользователей. В нем работает группа компьютерных музыкантов, которые размечают музыку в нескольких измерениях. В конце концов, они используют 400 функций (то, что Pandora называет генами). После маркировки каждую песню можно представить в виде 400-мерного вектора.
Jinni также проделала аналогичную работу, разработав собственную генетическую систему фильма и позволив экспертам маркировать фильм.
После экспертной аннотации Jinni также будет использовать технологию машинного обучения для аннотирования фильма, анализируя комментарии пользователей к фильму и атрибуты контента фильма. Jinni решает проблему холодного запуска системы, комбинируя экспертную систему и метод машинного обучения.