TF-Ranking
Это библиотека с открытым исходным кодом, основанная на платформе TensorFlow, для решения крупномасштабных задач ранжирования. Он основан на том, что обычно называют“排序学习/ Learning to Rank” (LTR)
базовая технология. Этот метод широко используется как поиск и рекомендация. TF-Ranking — это первая библиотека глубокого обучения с открытым исходным кодом для задач LTR, получившая широкое распространение в отрасли. Далее я представлю основные функции библиотеки и несколько небольших примеров.
Принятие в отрасли:
- Grubhub
- Знай почти
- ИКИИ
- ...
Сортировать обучение
Общие сценарии следующие:
Архитектура рейтинга TF
Основной модуль TF-рейтинга
- Функция потерь: потеря ранжирования является основной технологией обучения ранжированию.
- Метрики: эффект ранжирования должен основываться на метриках ранжирования как наилучших критериях оценки.
- Конвейеры: Конвейеры просты в использовании для построения и обучения ранжированию моделей.
Функция потерь: можно разделить на 3 метода
1) Метод единого документа
- Рассмотрим каждый документ отдельно
- Некоторые примеры включают: порядковую регрессию, классификацию, деревья градиентной регрессии (GBRT).
2) Выравнивание документа
- Рассмотрите пары документов: подумайте, является ли документ А более релевантным, чем документ Б.
- Некоторые примеры включают: RankNet, RankSVM, RankBoost.
3) Метод списка документов
- Рассмотрим порядок всего списка
- Вот некоторые примеры: lambdamart, procndcg, list {net, mle}
Примеры поддерживаемых функций потерь
Примеры поддерживаемых показателей сортировки
Воронка рейтинга TF
Пользователю нужно только определить зеленый модуль:Код для реализации вышеуказанных шагов: