Как Quora дает рекомендации?

искусственный интеллект
Чжан Лян, соучредитель Zhihu, задал г-ну Ю Цзюню вопрос о компании Worth: «Исходя из вашего опыта, как вы думаете, какие три-пять улучшений продукта необходимо сделать Zhihu наиболее срочно?» Г-н Юй Цзюнь сказал Первое мнение, данное в ответе: «Майнинг и продвижение персонализированного контента, я знаю, что в Zhihu есть много контента, который меня интересует, но есть только несколько контента, продвигаемых Zhihu, который я готов чтобы щелкнуть, всегда дайте мне почувствовать, что я вхожу в Баошань и возвращаюсь с пустыми руками. В этом отношении NetEase Cloud Music, Taobao и Toutiao — все это хорошие объекты для обучения». Итак, как Quora, известная как «версия для США Zhihu», дать рекомендации? Следующий контент выбирается из RecsysChina.

Ксавье Аматриан, вице-президент Quora по машинному обучению, выступил с докладом на семинаре по вопросам ответов на конференции WWW2016.Machine Learning for Q&A Sites: The Quora Example[1].


Миссия на Quora:To share and grow the world's knowledge.

Quora в основном учитывает три фактора: актуальность, качество и спрос.


Основная модель данных Quora и ее отношения:



Feed Ranking

Одной из основных проблем рекомендации Quora является персонализированный рейтинг ленты. Quora связывает «знания» с вопросами, ответами и темами в качестве ядра, а затем разделяет качество контента на основе действий пользователей, таких как лайки и антипатии, и, наконец, позволяет знаниям распространяться в сообществе через отношения Follow между людьми и вопросами. . И личная лента — важнейший носитель этого «потока». Ксавьер сказал, что Quora сложнее проводить рейтинг каналов, чем Netflix, и это нормально.Если не будет более сложной задачи, Ксавье не поменяет работу, верно? Основная цель Quora Feed Ranking — обеспечить, чтобы контент, помещаемый в ленту пользователя, был максимально релевантен интересам пользователя. Во-вторых, необходимо учитывать последующие отношения и взаимодействие между пользователями. Ксавье называет это социальной релевантностью, и существует также фактор времени. , такие как некоторые вопросы и ответы, связанные с горячими событиями, также должны быть своевременно отправлены в ленту пользователей.

1. Цель: Представить пользователю самые интересные истории в данный момент времени.

  • Interesting = topical relevance + social relevance + timeliness
  • Stories = questions + answers

2. Основное использование - персонализированный метод обучения для ранжирования.
3. Ксавьер подтвердил, что ранжирование релевантности по сравнению с ранжированием по релевантности значительно повышает вовлеченность пользователей.
4. Проблемы, с которыми сталкиваются:

  • potentially many candidate stories
  • real-time ranking
  • optimize for relevance


На рисунке ниже показана самая базовая структура данных рейтинга каналов Quora, который Quora называет «журналами показов».



В отношении этих основных поведений функция релевантности, определенная Quora, выглядит следующим образом.


Проще говоря, он использует «поведенческую функцию взвешивания», чтобы предсказать интерес пользователя к истории. Существует два необязательных метода расчета: один заключается в том, чтобы поместить все действия в регрессионную модель, чтобы напрямую предсказать конечное значение, другой — сначала предсказать возможность каждого действия (например, лайкнуть, прочитать, поделиться и т. д.), а затем комбинированный. взвешенное суммирование. Первый простой, но интерпретируемость немного плохая.Второй может лучше использовать каждый сигнал действия, но требует классификатора для каждого действия, что требует больших вычислительных ресурсов.

Quora использует три основных типа моделей:


Кроме того, Ксавьер также подчеркнул важность разработки функций. Усердная работа над этим очень полезна для получения в конечном итоге хорошего результата ранжирования. Было бы лучше, если бы функции могли обновляться онлайн в режиме реального времени, чтобы пользователи могли обновляться в более своевременное поведение в ответ. Наиболее важные функции Quora включают в себя:

  • user (e.g. age, country, recent activity)
  • story (e.g. popularity, trendiness, quality)
  • interactions between the two (e.g. topic or author affinity)


С точки зрения общей структуры, нет ничего особенного в рейтинге каналов Quora, который в основном является стандартным стилем игры в отрасли. Что особенного в Quora, так это то, что его модель данных сложнее, чем у других сайтов, а отношения между ними более разнообразны. Например, с точки зрения пользователя вы можете следить за другими пользователями, следить за вопросами и следить за темами.

  1. Подписчики получают более широкий и разнообразный спектр информации. Контент-сюрприз, скорее всего, исходит от интересных пользователей, на которых они подписаны, но также может быть проще всего создать нерелевантный информационный шум. Самая важная работа в этой области — профессионализм пользователей. .
  2. Вопрос/Ответ — это основной элемент контента Quora, а также движущая сила потока знаний в системе Quora.Основная задача этого раздела — помочь более профессиональным пользователям дать качественные ответы и узнать, как чтобы стимулировать производство большего количества хороших вопросов (даже автоматически сгенерированных вопросов), ранжирование ответов и работу против SAPM.
  3. Тема — это совокупность содержания темы. Тема играет чрезвычайно важную роль в информационной архитектуре Quora и является скелетом структуры знаний. Quora называет ее тематической сетью. которые необходимо решить, включают в себя, как обнаружить (потенциально) качественные проблемы в рамках темы, и как уменьшить вес проблем с водой и отфильтровать/объединить повторяющиеся проблемы.

    Над этими ключевыми вопросами Quora провела более глубокую работу.Answer Ranking
    Цель: Имея вопрос и n ответов, составить идеальное ранжирование этих n ответов.

    Quora в основном учитывает следующие три измерения для расчета рейтинга, и каждое большое измерение содержит множество функций.
  4. Качество самого ответа. У Quora есть четкие указания относительно того, что представляет собой «хороший ответ»[2], например, он должен быть основанным на фактах, многократно использоваться, давать объяснения, быть хорошо отформатированным и так далее.
  5. Взаимодействие, в том числе лайки/нелайки, комментарии, публикации, избранное, клики и многое другое.
  6. Некоторые характеристики самих респондентов, например, опыт респондентов в области вопроса.

Кроме того, эта работа также включает в себя две части: неперсонализированные и персонифицированные.Некоторые типы вопросов ранжируются нелично, и лучший ответ одинаков для всех пользователей, тогда как другие вопросы являются персонифицированными.Индивидуализированные, и лучший ответ для у каждого человека будет свое индивидуальное суждение. Короче говоря, рейтинг ответов очень важен для Quora. Эта Quora проделала очень подробную работу. Об этом есть специальная статья в блоге Quora. Заинтересованные друзья могут пойти посмотреть исходный текст [3].

The Answer Ranking system end-to-end


Ask2Answers

A2A — очень важная функция в продукте Quora.Изначально Quora могла напрямую рекомендовать релевантные вопросы соответствующим ответчикам, которые считает система.Quara делала это в начале, но, очевидно, лучше мобилизовать массы, чтобы делать это автоматически.Это чувствует себя хорошо, когда тебя приглашают ответить. Операция А2А усиливает чувство ритуала, заставляя приглашенного чувствовать себя нужным и психологически удовлетворенным. Кроме того, это также социальное действие. пользователей.Удобство ", и случайное "спасибо/слабительное" перед ответом на вопрос, все сказано. Эта функция кажется очень простой, и Quora также усердно работала Quora смоделировала проблему A2A в проблему машинного обучения: заданный вопрос и зритель ранжируют всех других пользователей в зависимости от того, насколько они «хорошо подходят». Среди них «подходящий» = вероятность того, что зритель отправит запрос + вероятность того, что кандидат добавит хороший ответ, учитывая как возможность того, что зритель отправит приглашение, так и возможность того, что приглашенному будет предложено ответить. В блоге Quora также есть статья, подробно объясняющая их подход [4].



Topic Network

Quora приложила много усилий, чтобы правильно направлять пользователей к тегам контента, и преимущества продолжения этой работы начинают постепенно проявляться, как они обнаружили [5].

  1. С расширением пользовательской базы Topic демонстрирует импульс быстрой диверсификации.
  2. Многие области имеют самоорганизованные довольно хорошие иерархические структуры знаний.


Quora считает, что такой способ организации знаний в предметной области с опорой на сообщества возможен.



User Trust/Expertise Inference

Это еще одна очень важная особенность Quora: Quora должна найти экспертов в определенной области, а затем направлять этих экспертов через продукты, чтобы предоставить более качественные ответы в этой области. Quora будет учитывать, сколько пользователей отвечают на вопросы в определенной области, и получать такие данные, как лайки, антипатии, благодарности, публикации, избранное и просмотр. Еще одним важным моментом является эффект распространения профессионализма, например, Ксавьер проголосовал за определенный ответ в области рекомендательных систем, то автор этого ответа, вероятно, имеет высокую степень профессионализма в области рекомендательных систем.

разное

К другим связанным относятся рекомендации тем, рекомендации пользователей, связанные вопросы, повторяющиеся вопросы, защита от спама и т. д. Quora использует методы машинного обучения для решения этих проблем.

Самое большое сокровище Quora — это большое количество ценного контента, который накопился в разных областях за последние несколько лет, естественно Quora тоже должна их раскопать, есть статья под названиемMapping the Discussion on Quora Over Time through Question Text[6] — хороший пример анализа ценности данных.

Как со временем изменились несколько тем, включая Facebook


Использованная литература:

[1] Woohoo.slide share.net/Маленький Амат/Ма Чи…

[2] Woohoo Quora.com/what-does-ahhh…

[3] Engineering.Quora.com/A-machine-l…

[4] Engineering.Quora.com/ask-to-A Вы говорите мне…

[5] data.Quora.com/the-Quora-T…

[6] data.Quora.com/mapping — он и…

Для получения более подробной информации или подачи заявки на пробную версию продукта посетите веб-сайтИнтеллектуальные рекомендации четвертой парадигмы Продукты Первая рекомендацияОфициальный сайт!

Этот аккаунтИнтеллектуальные рекомендации четвертой парадигмы Продукты Первая рекомендацияофициальный аккаунт. Эта учетная запись основана на компьютерной области, особенно на передовых исследованиях, связанных с искусственным интеллектом. Она направлена ​​на то, чтобы поделиться с общественностью большим количеством знаний, связанных с искусственным интеллектом, и способствовать пониманию общественностью искусственного интеллекта с профессиональной точки зрения. открытая платформа для обсуждения, общения и обучения, чтобы каждый мог как можно скорее насладиться ценностью, созданной искусственным интеллектом.