Рекомендательные методы системной фильтрации: контентная фильтрация, ее плюсы и минусы

искусственный интеллект

В предыдущей статье мы представилиРекомендуемая системаосновной рабочий процесс. В следующей статье мы подробно разберем методы фильтрации в рекомендательных системах.

Различные методы фильтрации в рекомендательных системах

Для того чтобы рекомендательная система могла предоставлять практические и полезные рекомендательные услуги пользователям, крайне важны эффективные и точные методы рекомендаций, то есть понимание характеристик и возможностей различных методов фильтрации рекомендаций имеет решающее значение.

На следующей диаграмме показаны различные методы фильтрации в рекомендательных системах:

Различные методы фильтрации в процессе рекомендаций

Контентная фильтрация

Фильтрация на основе содержимого (CBF) — это алгоритм, зависящий от предметной области, который уделяет больше внимания анализу атрибутов элементов при создании прогнозов. Этот метод фильтрации наиболее эффективен, когда рекомендуемыми объектами являются текстовые элементы, такие как веб-страницы, публикации и новости.

Технология фильтрации на основе контента опирается на портреты пользователей при рекомендации, а портреты пользователей получаются из элементов, которые пользователи оценили, и пользователям будут рекомендованы наиболее релевантные элементы с положительными оценками пользователей.

Чтобы генерировать значимые результаты рекомендаций, CBF использует разные модели для поиска сходства между текстовыми элементами. Он может использовать модель векторного пространства (Vector Space Model), например метод расчета веса ключевого слова (TF/IDF, частота терминовInverse Document Frequency) или вероятностные модели, такие как наивные байесовские классификаторы, деревья решений или нейронные сети, которые моделируют отношения между различными текстовыми элементами в корпусе. После этого базовая модель изучается с помощью статистического анализа или методов машинного обучения для получения результатов рекомендаций.

Технологии контентной фильтрации не нужно ссылаться на другие портреты пользователей, потому что другие портреты пользователей не повлияют на окончательный результат рекомендации. Более того, если профиль пользователя изменится, технология CBF все еще может скорректировать результаты рекомендаций за очень короткий период времени. Основным недостатком этой методики является то, что она требует от системы достаточно глубокого понимания особенностей содержания проекта.

Плюсы и минусы методов контентной фильтрации

Контентная фильтрация устраняет проблемы, возникающие при совместной фильтрации, — контентная фильтрация может рекомендовать пользователям новые элементы, даже если никто из пользователей не ставит оценки. Поэтому, даже если в базе нет интересов пользователей, это не повлияет на точность результатов рекомендаций.

Более того, если интересы пользователя меняются, контентная фильтрация может корректировать результаты своих рекомендаций за короткий промежуток времени. Пользователи могут получать результаты рекомендаций, не раскрывая свою личную информацию, что в значительной степени обеспечивает безопасность личной жизни.

Кроме того, методы CBF также могут объяснить, как генерировать рекомендации для пользователей.

Однако методы фильтрации на основе содержимого зависят от метаданных элемента. То есть, прежде чем рекомендовать пользователям, системе нужны расширенные описания содержимого элементов и полные портреты пользователей, то есть «ограниченный анализ контента». Следовательно, эффективность CBF зависит от наличия описательных данных.

Еще одна серьезная проблема, с которой сталкивается технология CBF, — чрезмерно профессиональный контент. Пользователи могут получать только те результаты рекомендаций, которые аналогичны элементам в их собственном профиле.

Вышеизложенное является нашим введением в технологию фильтрации на основе содержимого.В следующей статье мы сосредоточимся на технологии совместной фильтрации.Добро пожаловать!


Связанное чтение:

Рабочий процесс системы рекомендаций

Народная система рекомендаций

Хотите узнать о рекомендательных системах? Смотри сюда! (2) - Метод нейронной сети

Хотите узнать о рекомендательных системах? Смотри сюда! (1) - Совместная фильтрация и разложение по единичным значениям

Как AutoML реализует автоматический онлайн и O&M интеллектуальной системы рекомендаций?

Начало работы с рекомендательными системами, список знаний, которые вы не должны пропустить

Если вы хотите узнать больше, выполните поиск и обратите внимание на первую рекомендацию общедоступной учетной записи WeChat (ID: dsfsxj), учетную запись Zhihu (первая рекомендация четвертой парадигмы).