Галантерея | Глубокое изучение пяти исследовательских горячих точек системы персонализированных рекомендаций (1)

искусственный интеллект

[Примечание редактора] В нашу эпоху стремительного технологического развития и информационного взрыва не будет преувеличением сказать, что рекомендательные системы полностью интегрированы в нашу жизнь. В какой ресторан мы ходим, какую одежду покупаем, какую информацию просматриваем и какие видео смотрим — все это во многом зависит от рекомендательной системы.

В этой статье исследователи из группы социальных вычислений Microsoft Research Asia прогнозируют будущее направление развития рекомендательных систем по пяти аспектам: глубокое обучение, графы знаний, обучение с подкреплением, портреты пользователей и интерпретируемые рекомендации. Полный текст был разрешен для перепечатки Microsoft Research AI Toutiao (ID: MSRAsia). Сухих статей много, рекомендуем собирать!

«Думаю, вам это нравится», «Пользователи, которые приобрели этот продукт, также купили его...» Для современных интернет-пользователей, неотделимых от социальных платформ, электронной коммерции, чтения новостей и жизненных услуг, персональные рекомендации не являются чем-то новым. .

С развитием информационных технологий и интернет-индустрии информационная перегрузка стала проблемой для людей при обработке информации. Для пользователей, как быстро и точно найти нужный им контент в экспоненциально растущих ресурсах, является очень важной и сложной задачей. Торговцам также довольно сложно своевременно предоставлять пользователям соответствующие товары, тем самым способствуя увеличению объема транзакций и экономическому росту. Рождение рекомендательных систем значительно упростило эту трудность.

Система рекомендаций — это система фильтрации информации, которая может изучать интересы и увлечения пользователя на основе профиля пользователя или исторических записей о поведении, а также прогнозировать рейтинг или предпочтения пользователя для данного элемента. Это меняет способ общения компаний с пользователями и укрепляет взаимодействие с пользователями.


Сообщается, что рекомендательные системы обеспечивают 35% продаж Amazon, до 75% потребления Netflix, а 60% просмотров на главной странице Youtube приходятся на службы рекомендаций.

Поэтому то, как построить эффективную систему рекомендаций, имеет далеко идущее значение. мы начнемПрименение глубокого обучения, применение графа знаний, применение обучения с подкреплением, портрет пользователя и объяснимая рекомендацияДавайте вместе посмотрим на будущее рекомендательных систем. Эта статья будет посвященаПрименение глубокого обучения в рекомендательной системеоткрытое обсуждение.

Рекомендательные системы и глубокое обучение

В последние годы применение технологии глубокого обучения в распознавании речи, компьютерном зрении и понимании естественного языка достигло больших успехов, и вопрос о том, как применить ее к рекомендательным системам, является актуальным направлением исследований. Текущее применение системы глубоких рекомендаций в основном отражено на следующих трех уровнях:

  1. Улучшить способность к обучению представлению.Преимущество глубоких нейронных сетей заключается в их мощных возможностях обучения представлениям. Таким образом, одним из самых прямых приложений является,Используя технологию глубокого обучения для изучения эффективного представления скрытых факторов из сложных данных контента, ее можно легко использовать в рекомендательной системе позже.
  2. Глубокая совместная фильтрация.Классическую модель матричной факторизации можно описать как очень простую нейронную сеть. мы можемЗа счет расширения ее структуры и введения большего количества нелинейных единиц функция рекомендательной модели усиливается.Например, в статье WWW 2017 г.Neural collaborative filteringВ статье автор предлагает расширенную версию модели матричной факторизации. С одной стороны, это компенсирует недостаток, заключающийся в том, что наивная операция скалярного произведения двух скрытых векторов не может различить разницу важности между измерениями; с другой стороны, она дополнительно вводит многослойный модуль персептрона, чтобы ввести большую нелинейность работы. Кроме того, технологии, связанные с глубоким обучением, такие как автокодировщики, сверточные нейронные сети, сети памяти и сети внимания, также применялись для улучшения традиционных моделей совместной фильтрации и давали хорошие результаты.
  3. Глубокие взаимодействия между функциями.Чтобы максимизировать точность модели, рекомендательные системы корпоративного уровня часто используют обширные и даже разнородные данные контента. Эти функции представляют разную информацию из разных измерений, и комбинация функций обычно имеет большое значение. Традиционные элементы пересечения разрабатываются инженерами вручную, что очень ограничено, дорого и не может быть расширено до невиданных ранее перекрестных узоров. Поэтому ученые стали изучатьИспользуйте нейронные сети для автоматического изучения шаблонов взаимодействия функций высокого уровня, чтобы компенсировать ограничения, связанные с ручным проектированием функций.Модели, относящиеся к этому уровню, включают Wide&Deep, PNN, DeepFM, DCN и нашу недавно предложенную модель xDeepFM («xDeepFM: сочетание явных и неявных взаимодействий функций для рекомендательных систем», KDD 2018) и так далее.

Перспектива применения технологии глубокого обучения в рекомендательной системе очень широка. Несколько возможных направлений будущих исследований кратко описаны ниже:

1. Эффективность и масштабируемость

Для промышленных рекомендательных систем необходимо учитывать не только модельТочность,операционная эффективностьиремонтопригодностьтоже очень важный аспект. Эффективность означает, что когда пользователь отправляет запрос, система рекомендаций может возвращать результаты почти в режиме реального времени, не заставляя пользователя ждать; ремонтопригодность означает, что система проста в развертывании и может поддерживать регулярные или добавочные обновления. Как мы все знаем, вычислительная сложность сложных нейронных сетей огромна.Как применить их более эффективно на сверхкрупномасштабной рекомендательной платформе — это техническая трудность, которую необходимо решить в срочном порядке.

2. Слияние диверсифицированных данных

На реальных платформах данные пользователей или элементов часто бывают сложными и разнообразными. Содержимое элементов может включать текст, изображения, категории и другие данные; данные о поведении пользователя могут поступать из разных областей, таких как социальные сети, поисковые системы, приложения для чтения новостей и т. д.; отзывы о поведении пользователя также могут быть богатыми и разнообразными, например в качестве веб-сайтов электронной коммерции поведение пользователя может включать поиск, просмотр, нажатие, сбор, покупку и т. д. Мало того, что в этих разных измерениях распределение данных о разных пользователях или элементах также сильно различается; объем данных о пользователях по разным отзывам о поведении также отличается, и объем данных о поведении кликов часто намного больше, чем объем данных о покупке. поведение. Поэтому единая однородная модель не может эффективно обрабатывать эти разнообразные данные.Глубокая интеграция этих сложных данных представляет собой техническую трудность.

3. Зафиксируйте долгосрочные и краткосрочные предпочтения пользователей

Пользовательские предпочтения можно условно разделить на долгосрочные и краткосрочные. Долгосрочные предпочтения часто относятся к интересам пользователя. Например, если он фанат Mayday, его будут интересовать песни Mayday и билеты на концерты в течение длительного времени в будущем; краткосрочные предпочтения относятся к непосредственному интересу пользователя к текущую среду, например, недавно. Если пользователи предпочитают слушать популярные песни на Douyin через неделю, система рекомендаций также должна учитывать интерес пользователя, или если пользователь планирует переехать в следующем месяце, система рекомендаций может соответствующим образом подтолкнуть некоторые реклама мувинговой компании. В настоящее время некоторые популярные практики заключаются в объединении рекуррентной нейронной сети с технологией глубокой совместной фильтрации, чтобы реализовать функцию учета долговременной и кратковременной памяти.Как совместить влияние контекстуальных факторов, чтобы более тесно и эффективно совместить долгосрочные предпочтения пользователей с краткосрочными потребностями, также является предметом исследований.


В следующей статье мы будем вращаться вокруг «Система рекомендаций и график знаний", чтобы обсудить исследование. Если вы хотите узнать больше об горячих точках исследований о системе рекомендаций, пожалуйста, продолжайте обращать внимание, добро пожаловать, чтобы делиться и собирать!