Познавательная популярность
Популярность
Популярность контента, также известная как популярность, чаще всего заключается в том, чтобы рекомендовать популярный контент в списке пользователям (горячий поиск Weibo, продукты TopN).
Рекомендация, основанная на популярности, — это рекомендательная модель (не только TopN), созданная на основе расчета популярности.
Решить проблему холодного старта => алгоритм рекомендации продуктов на основе популярности, то есть какой контент привлекает пользователей, какой контент рекомендуется пользователям
Популярность — это мера популярности продукта. Необходимо детально проанализировать, насколько он эффективен для результатов рекомендаций.
Анализ популярности в MovieLens
5 баллов и 1 балл — небольшой процент, но они наиболее ценны для системы.
(5 баллов и 1 балл самые ценные в Youtube)
Небольшой процент товаров с высокой популярностью
Оценки предметов с низкой популярностью сильно различаются (менее популярные => судят по вашим предпочтениям).
Оценки предметов с высокой популярностью мало чем отличаются (более популярные => предпочтения группы имеют большее влияние)
Понять тенденции популярности из набора данных:
Набор данных MovieLens
Фильмы с высокими, средними и низкими рейтингами с одинаковыми тенденциями рейтингов с течением времени.
Тенденция изменения показателя с течением времени заключается в том, что он сначала увеличивается, а затем уменьшается.
=> Тенденция изменения оценок с течением времени важна
Элементы с высокой популярностью имеют меньшие колебания оценок, тогда как предметы с низкой популярностью имеют большие колебания оценок.
=> Стадный менталитет пользователя
Рекомендации на основе популярности (холодный старт, персональные рекомендации)
проблема с холодным запуском
• Когда информации о поведении пользователя недостаточно, используйте неперсонализированные рекомендации.
• Суть алгоритма, какой контент привлекает пользователей, какой контент рекомендует пользователям
• Он также должен быть репрезентативным и дифференцированным, то есть не слишком общим или подходящим для всех возрастов => не может различать интересы пользователей.
• Разнообразие, существует много возможностей для интересов пользователей, чтобы соответствовать разнообразию интересов => предоставить набор стартовых элементов с широким охватом (эти элементы могут охватывать основные интересы пользователей)
• MovieLens, общедоступный набор данных
• Краудсорсинговый набор данных 100 000 без общих предубеждений, найденных на общедоступных веб-сайтах.
• Эффект Мэтью => Не так заметен в краудсорсинге, как MovieLens
• Теория длинного хвоста => вездесуща. Нишевые потребности пользователей в сумме дают много
Как пользоваться индикатором популярности
Популярность - это решение проблемы недостаточной информации о пользователях, когда новые пользователи только регистрируются в начале, и мы не можем очень хорошо предоставлять рекомендательные услуги и рекомендовать популярные из популярных трендов. Решение проблемы холодного старта и разреженности данных — самое большое направление рекомендательной системы, с одной стороны, оно исходит из характеристик самой рекомендательной системы.
1. Для новых пользователей используйте неперсонализированные рекомендации (рекомендации, основанные на популярности)
2. Для старых пользователей можно рассмотреть влияние высокой популярности на снижение веса товарных рекомендаций и коснуться длинного хвоста
Кроме того, необходимо учитывать характеристики разных веб-сайтов, разные веб-сайты имеют разные цели и планируют решение разных задач.
· Сайты электронной коммерции, такие как специальные предложения VIP.com, нацелены на создание хитов
· Сайты знакомств, такие как Jiayuan, нацелены на то, чтобы привлечь больше людей
Рекомендательная системная архитектура
• В онлайн-части фаза отзыва установит 1 миллион элементов => 1000. Если элементов слишком много, можно выполнить грубую сортировку. На этапе сортировки используется относительно сложная модель для сортировки меньшего количества элементов. Перед тем, как представить его пользователю, также будут собраны некоторые бизнес-стратегии (удалить прочитанную пользователем, коммерциализированную рекламу).
• В ближней части собирайте отзывы о поведении пользователей в режиме реального времени, выбирайте обучающие экземпляры, извлекайте функции => обновляйте модель онлайн-рекомендаций.
• Автономная часть, систематизация данных обучения в автономном режиме => Периодически обновлять рекомендуемую модель