Как построить рекомендательную систему без пользовательских данных? Используйте эти три метода!

Эта учетная запись является официальной учетной записью для первой рекомендации интеллектуальных рекомендательных продуктов 4Paradigm. Аккаунт основан на компьютерной сфере, особенно на передовых исследованиях, связанных с искусственным интеллектом. Он направлен на то, чтобы поделиться с общественностью большим количеством знаний, связанных с искусственным интеллектом, и способствовать пониманию общественностью искусственного интеллекта с профессиональной точки зрения. Предоставить открытую платформу. для обсуждения, общения и обучения, чтобы каждый мог как можно скорее насладиться ценностью, созданной искусственным интеллектом.

Даже без пользовательских данных мы все равно можем построить эффективную систему рекомендаций, чтобы показывать пользователям более качественный контент и вовлекать их.

Слишком длинная версия для чтения:

Первым шагом является создание рекомендательной системы на основе контента, которая рекомендует пользователям другие аналогичные продукты, не полагаясь на данные других пользователей. Эти функции (т. е. математические выражения, на которые опирается алгоритм рекомендации для работы с выражениями в различных аспектах элемента контента) исходят из самого элемента контента, а не из поведения пользователя. В письменном тексте мы можем извлечь текстовые особенности, используя семантические методы.

Взяв приведенную выше систему рекомендаций в качестве базовой модели, мы можем ввести другие функции, такие как метаданные, извлеченные из текста, чтобы максимально оптимизировать систему. Хотя явной идентификации пользователя нет, персонализированные рекомендации все же можно получить с помощью прокси-серверов учетной записи пользователя. Если предположить, что пользователи просматривают несколько элементов каждый раз, когда они посещают систему, локальная система рекомендаций на основе сеанса может быть построена на основе тенденций в реальном времени в рамках сеанса.

Текстовая версия:

«Как построить рекомендательную систему без пользовательских данных?» Мы много раз сталкивались с этим вопросом, и сегодня я постараюсь на него ответить.

В этой статье вы познакомитесь с набором основ работы рекомендательных систем, используя (в важных частях) некоторые отраслевые термины. Когда дело доходит до технических вопросов, вам будет объяснена конкретная техническая среда.

Вообще говоря, есть три возможных способа построить рекомендательную систему без пользовательских данных. Я перечислил их ниже по уровню сложности, предполагая, что у вас есть все данные, которые у вас есть под рукой на данный момент. Из этих трех методов каждый из последних лучше использует пользовательские данные, такие как уникальные идентификаторы и пользовательская информация, чем первый, но на самом деле у вас нет этих данных под рукой.

Построение системы рекомендаций на основе контента

Во-первых, мы можем создать стандартную рекомендательную систему на основе контента с определенными тегами или другими метаданными контента и т. д. Мы можем оценить алгоритм, применив модель TF-IDF, где эти метки представляют каждое слово в предварительно вычисленном словаре (словарь просто ссылается на структуру данных, которая представляет собой набор всех слов в тексте).

В частности, если мы используем все метки и другие функции для построения словаря, словарь помогает нам построить то, что называется «вектором признаков». После этого на основе вектора признаков мы сравниваем разные элементы контента, чтобы построить систему рекомендаций. На данный момент система рекомендаций на основе контента была изначально завершена, и, исходя из моего исследовательского опыта, рекомендательный эффект этой системы довольно хороший. Все, что мы сейчас делаем, — это рекомендуем пользователям элементы, похожие на исторические элементы. Термин «похожий» здесь означает, что рекомендуемый элемент имеет аналогичные ярлыки и характеристики по сравнению с историческим элементом.

Если мы хотим построить рекомендательную систему с более высокой точностью, первое, что нужно сделать, — это повторить вышеупомянутую первичную рекомендательную систему и продолжить оптимизацию на этой основе. Далее я представлю другие методы.

Оптимизация рекомендательных систем на основе контента

В приведенных выше шагах используется один словарь, содержащий существующие метки и другие функции. Следующим шагом для повышения точности рекомендаций является создание двух или более словарей — соответствующих разным категориям метаданных, мы можем использовать статистический метод TF-IDF в системе рекомендаций на основе нескольких словарей для расчета оценки каждого элемента контента. комбинация. Мы можем оптимизировать параметры (например, вес каждой оценки) на основе результатов субъективной оценки. Это зависит от того, вес какого параметра может принести наилучший рекомендательный эффект.

Если определенный тип метаданных не может быть взвешен TF-IDF, например, этот набор данных не имеет значения, то я рекомендую вам разделить этот набор данных на разные типы. После выполнения этого подразделения мы получаем еще один набор меток (каждый тип данных после подразделения имеет свою соответствующую метку). Если предположить, что в процессе не появятся другие функции, это не усложнит всю работу.

Далее в систему может быть внедрена технология фильтрации, например добавление определенного тега, для дальнейшей оптимизации системы рекомендаций. Он не является частью основного алгоритма, но если мы хотим встроить какой-то алгоритм в рекомендательную систему, чтобы реализовать работу определяемых пользователем критериев рекомендаций, то технология фильтрации является дополнительной поддерживающей структурой алгоритма.

Создание системы рекомендаций с использованием пользовательских агентов

Следующим шагом в повышении точности рекомендаций системы является наблюдение за теми функциями данных, которые могут действовать как пользовательские агенты. Хотя у нас нет учетных записей пользователей, у нас могут быть IP-адреса, информация о браузере, пользовательские сеансы и другая информация.

На этом этапе мы можем создавать абстрактных пользователей. Этот тип учетной записи пользователя не может быть проверен, но он имеет прототип технологии отпечатков пальцев. Как только мы сможем назвать «абстрактного» пользователя, мы сможем генерировать персонализированные рекомендации для этого пользователя, в частности, используя различные методы совместной фильтрации. На мой взгляд, это не сложно — мы можем найти множество проектов с открытым исходным кодом (например, высокоуровневые пакеты Python). Суть в том, что мы можем создавать учетные записи пользователей с помощью существующей информации о прокси.

Кроме того, нам также нужны данные о взаимодействии кликов пользователя. Нам нужно знать, какие продукты были выбраны пользователями, иначе нет возможности дальнейшей оптимизации в соответствии с предпочтениями пользователей. Как только данные о кликах пользователя и абстрактные учетные записи пользователей станут доступны, можно создать систему персонализированных рекомендаций, состоящую из IP-адресов и информации о браузере. Это не совсем персонализированные рекомендации, но и недалеко от настоящей персонализации.

Построение системы рекомендаций на основе сеансов

Последний описанный подход заключается в построении рекомендательной системы на основе сеансов. Это похоже на подход, упомянутый ранее, но на этот раз мы сосредоточимся на данных в рамках определенного сеанса. Даже если мы не можем получить информацию о пользователе, можно получить данные о сеансе пользователя. Учетную запись сеанса пользователя можно приравнять к строго локализованной «учетной записи пользователя».

Существует множество рекомендательных систем на основе сеансов, некоторые из которых основаны на рекуррентных нейронных сетях (RNN) с чрезвычайно высокой точностью, например, исследование, проведенное Hidasi и Karatzoglou. Рекомендательные эффекты этих систем вполне удовлетворительны.

Системы рекомендаций на основе сеансов предполагают, что пользователи готовы оставаться в системе в течение определенного периода времени. Если пользователь сделает это и нажмет достаточное количество раз, рекомендация системы будет лучше, а рекомендуемый контент будет более привлекательным для пользователя.

Оригинальное название:Каковы три способа создания системы рекомендаций, когда у вас нет AudienceData?

Вышеупомянутый контент исходит от Quora, скомпилирован и опубликован четвертой парадигмой.

Связанное чтение:

Хотите узнать о рекомендательных системах? Смотри сюда! (2) - Метод нейронной сети

Хотите узнать о рекомендательных системах? Смотри сюда! (1) - Совместная фильтрация и разложение по единичным значениям

Как AutoML реализует автоматический онлайн и O&M интеллектуальной системы рекомендаций?

Начало работы с рекомендательными системами, список знаний, которые вы не должны пропустить

Если вы хотите узнать больше, выполните поиск и подпишитесь на общедоступную учетную запись WeChat Xianjian (ID: dsfsxj).