Системы рекомендаций: обзор алгоритмов

Сегодня многие компании разрабатывают рекомендательные системы, тесно связанные с их бизнесом. Как интеллектуальный рекомендательный продукт, разработанный 4Paradigm, Xianjian расширил возможности многих клиентов СМИ в индустрии контента и добился роста доходов клиентов. В этой статье мы кратко представим основные существующие алгоритмы рекомендаций и то, как они работают.

Совместная фильтрация

Коллаборативная фильтрация (CF) является одним из наиболее часто используемых алгоритмов рекомендаций. Даже новичок в системе рекомендаций может легко начать работу и использовать ее для создания своей личной системы рекомендаций фильмов.

Когда мы хотим что-то порекомендовать пользователю, логичнее всего будет найти других пользователей со схожими интересами с этим пользователем, проанализировать их поведение, а затем порекомендовать этот же товар нашему пользователю. Или мы можем посмотреть на историческое поведение пользователя и порекомендовать похожие элементы.

Выше приведены два основных метода в CF: совместная фильтрация на основе пользователей и совместная фильтрация на основе элементов.

Что означает «наиболее похожий» в алгоритме?

Вектор предпочтений для каждого пользователя (каждая строка матрицы R) и вектор оценок пользователей для каждого продукта (каждый столбец матрицы R) известны.

Во-первых, оставьте только известные значения двух векторов.

Во-вторых, предположим, что мы хотим сравнить двух пользователей Билла и Джейн, как видно из рисунка, пользователь Билл не видел «Титаник», а пользователь Джейн не видел «Бэтмена», поэтому мы можем пройти только «Звездные войны». », чтобы измерить сходство между ними. Что касается сходства, обычно измеряется косинусное сходство или корреляция между векторами пользователя/элемента.

Последним шагом является заполнение пустых ячеек таблицы взвешенным средним арифметическим на основе схожести пользователей.

Матричная факторизация в рекомендациях

Другой способ - использовать матричную факторизацию, этот алгоритм рекомендаций относительно более «элегантен». В общем, когда дело доходит до матричной факторизации, мало кто задумывается о том, какие элементы останутся в столбцах и строках результирующей матрицы. Используя этот алгоритм рекомендации, мы можем видеть, что u — вектор интереса i-го пользователя, а v — вектор параметров j-го фильма.

Следовательно, можно аппроксимировать скалярное произведение u и v как x (рейтинг от i-го пользователя до j-го фильма), построить вектор с известными оценками и использовать их для предсказания неизвестного рейтинга.

Например, после матричной факторизации мы получаем вектор пользователя Теда (1,4, 0,9) и вектор фильма А (1,4, 0,8), затем просто вычисляем скалярное произведение векторов (1,4, 0,9) и (1,4, 0,8), мы можем получить рейтинг A-Ted и результат 2,68.

кластеризация

Предыдущие алгоритмы рекомендаций довольно просты, и такие алгоритмы обычно подходят для небольших рекомендательных систем. Итак, представьте, что мы создаем большую рекомендательную систему, в которой совместная фильтрация и матричная факторизация заняли бы много времени. Первое, что мы должны сделать на этом этапе, — это кластеризация.

В начале бизнеса не хватает предыдущих оценок от пользователей, и лучшим подходом является кластеризация.

При наличии достаточного количества данных лучше всего использовать кластеризацию в качестве первого шага в сужении соответствующих вариантов совместной фильтрации. Кроме того, кластеризация также может повысить производительность сложных рекомендательных систем.

Каждый кластер представляет собой типичный класс пользователей. На основе профилей интересов пользователей в пользовательском кластере пользователи в кластере также получат соответствующие результаты рекомендаций.

Рекомендуемые методы глубокого обучения

За последние 10 лет технологии нейронных сетей достигли огромного прогресса. Сейчас нейронные сети широко используются в различных сферах и постепенно вытесняют традиционные методы машинного обучения. Далее давайте проанализируем, как YouTube использует методы глубокого обучения.

Нет сомнения, что построение рекомендательной системы для такого бизнес-сценария является очень сложной задачей из-за большого количества пользователей, динамического корпуса и различных неконтролируемых внешних факторов.

Согласно соответствующим исследованиямDeep Neural Networks for YouTube Recommendations, алгоритм рекомендательной системы YouTube состоит из двух наборов нейронных сетей: одного для генерации кандидатов и одного для ранжирования. Вот основные выводы исследования:

Принимая исторические события пользователя в качестве входных данных, мы значительно сокращаем количество видео через сеть генерации кандидатов, а затем создаем набор наиболее релевантных видео из большого корпуса.

Сгенерированные кандидаты наиболее релевантны пользователю, а затем прогнозируется ранг кандидата. Цель этой сети — предоставлять персонализированные рекомендации посредством совместной фильтрации.

На этом этапе будет небольшое количество кандидатов, похожих на пользователя. Далее нам нужно все более и более тщательно анализировать этих кандидатов, чтобы принять наилучшее решение — эту задачу выполняет рейтинговая сеть.

Сеть ранжирования может оценивать каждое видео на основе целевой функции, которая использует данные, описывающие видео, и информацию, связанную с поведением пользователя. Видео с самым высоким рейтингом сортируются по количеству баллов и представляются пользователю.

После двух вышеперечисленных шагов мы можем выполнить операцию, точно рекомендуя огромный набор видео пользователям, при этом гарантируя, что несколько видео по-прежнему являются персонализированными рекомендациями.

Источник статьи:Recommendation System Algorithms

Приведенный выше контент составлен по четвертой нормальной форме — первой рекомендации.

Связанное чтение:

Рабочий процесс системы рекомендаций

Народная система рекомендаций

Хотите узнать о рекомендательных системах? Смотри сюда! (2) - Метод нейронной сети

Хотите узнать о рекомендательных системах? Смотри сюда! (1) - Совместная фильтрация и разложение по единичным значениям

Как AutoML реализует автоматический онлайн и O&M интеллектуальной системы рекомендаций?

Начало работы с рекомендательными системами, список знаний, которые вы не должны пропустить

Если вы хотите узнать больше, выполните поиск и подпишитесь на общедоступную учетную запись WeChat Xianjian (ID: dsfsxj).

Эта учетная запись является официальной учетной записью для первой рекомендации интеллектуальных рекомендательных продуктов 4Paradigm. Аккаунт основан на компьютерной сфере, особенно на передовых исследованиях, связанных с искусственным интеллектом. Он направлен на то, чтобы поделиться с общественностью большим количеством знаний, связанных с искусственным интеллектом, и способствовать пониманию общественностью искусственного интеллекта с профессиональной точки зрения. Предоставить открытую платформу. для обсуждения, общения и обучения, чтобы каждый мог как можно скорее насладиться ценностью, созданной искусственным интеллектом.