0. Пишите впереди
Практики системы рекомендаций не должны быть незнакомы с моделью FM (Машины факторизации). Промышленность и академические круги также предложили серию моделей оптимизации, основанных на FM. Эти модели до сих пор широко используются в различных сценариях. В этой статье вы ознакомитесь с моделью FM и изучите ее принципы.
Личный опыт:
- По сравнению с LR, FM представляет комбинацию функций второго порядка.
- Параметры признаков оцениваются путем введения скрытых векторов посредством матричной декомпозиции, что решает проблему разреженности признаков и значительно сокращает количество параметров.
- По сравнению с MF (матричной факторизацией), FM может вводить другие функции, отличные от пользовательских функций и функций элементов, и имеет более широкий спектр приложений.
Адрес бумаги:
1. Предпосылки
Совместная фильтрация широко использовалась на заре персонализированных рекомендаций в рекомендательных системах. Совместная фильтрация реализует персонализированную рекомендацию, основанную на идее одной и той же аудитории похожих элементов или одинаковых предпочтений похожих пользователей.Для решения разреженной проблемы матрицы пользовательского интерфейса совместной фильтрации (матрицы пользователя-элемента) предлагается MF оценить элементы, с которыми пользователи не взаимодействовали. оценка между ними. Однако совместная фильтрация может учитывать только характеристики взаимодействия пользователей и элементов, характеристики самих пользователей и элементов, и эту модель нельзя использовать эффективно. Чтобы в полной мере использовать функции, люди применяют модель LR (линейная регрессия) к рекомендательному сценарию, но, как мы все знаем, LR — это линейная модель, и она не может соответствовать функциям второго порядка и выше. Чтобы решить эту проблему и в то же время обеспечить применимость модели, появилась FM-модель.
2. Архитектура модели
Давайте сначала рассмотрим набор типичных функций в рекомендательном сценарии, как показано на следующем рисунке.
После кодирования функции класса id мы получаем новую комбинацию функций в виде
Мы также упоминали выше, что если линейная модель LR первого порядка используется для подбора признаков, LR выражается как
LR здесь рассматривает только признаки первого порядка подобранной выборки и не рассматривает признаки второго порядка. Однако комбинированные признаки второго порядка, такие как «пол=мужской, цвет=синий», очень значимы. Тогда LR с учетом комбинированных признаков второго порядка может быть выражен как
По сравнению с LR первого порядка, LR второго порядка имеет дополнительный признак второго порядка, то есть признаки объединены в две группы для перечисления. Здесь возникают две проблемы:
- Количество параметров признаков второго порядка равно, количество параметров увеличивается экспоненциально.
- Проблемы с обучением, вызванные разреженными образцами. После кодирования большая часть битов категориальной переменной равна 0. После объединения с другими признаками значение по-прежнему равно 0, что приведет к разреженным выборкам. В процессе обучения LR для разреженных выборок параметры, соответствующие признакам со значением 0, будет сложно обновить.
FM-модель эффективно решает вышеуказанные проблемы, эффективно завершая работу комбинации признаков второго порядка, поэтому она широко используется в сценах пересечения различных признаков второго порядка. Форма реализации ФМ модели показана в следующей формуле
Можно видеть, что, за исключением разницы между термином признака второго порядка и моделью LR второго порядка, другие части точно такие же. Далее мы подробно объясним эту часть.
Член второго порядка FM-модели по-прежнему имеет место, когда перечисленные признаки пересекаются друг с другом, но отличие состоит в том, что параметры перекрестного признака второго порядка определяются скаляром.становится вектором,скалярное произведение .,Как показано ниже, признаки первого порядка каждого измеренияимеют соответствующие векторы.
можно увидеть,,размервектор , гдеявляются гиперпараметрами, установленными пользователем модели. Итак, здесь мы можем посчитать, количество параметров, используемых FM, равно, который является размером векторной матрицы выше. в,- количество признаков первого порядка,длина вектора (<<). По сравнению с LR второго порядкаМожно сказать, что количество параметров FM-модели значительно сокращает количество параметров модели, решая при этом упомянутую выше первую проблему. Поскольку каждому признаку первого порядка соответствует свой вектор, причем обновление каждого вектора в процессе обучения взаимодействует уже не только с одним вектором, а взаимодействует со всеми векторами,
Например, даже во всех образцахЭто не произошло одновременно и не влияет на его весобучение, потому чтово время тренировки согласно() и обновление, больше не зависит от, так же,также согласно() и обновление, больше не зависит от.
Таким образом, модель FM решает проблему изучения и обновления параметров в случае разреженных выборок.
3. Резюме
Как классическая модель в рекомендательной системе, модель FM решает взрыв параметров традиционной модели LR после пересечения функций второго порядка и обновления параметров при разреженных выборках, поэтому она широко используется в различных сценариях рекомендаций. Следуя модели FM, научные круги и промышленность также пытались провести работу по оптимизации FM с разных точек зрения, и появился ряд превосходных моделей для сценариев рекомендаций.