1. Предпосылки
Многие студенты могут не знать, насколько сложно начать с открытия приложения Meituan и заказа еды на вынос, а затем получить горячую еду от брата пассажира в течение получаса. Основная задача технической службы доставки Meituan — быстро направить сотни тысяч водителей по оптимальным маршрутам и ежедневно доставлять десятки миллионов заказов со всей страны каждому на максимальной скорости.
В этом сценарии очень важным звеном является время доставки гонщика, то есть, как долго гонщик может доставить пользователя после выхода из автобуса рядом с пользователем. На рисунке ниже показан временной состав заказа во всей цепочке дистрибуции, крайняя правая часть временной шкалы описывает положение цепочки доставки во всей цепочке дистрибуции. Время доставки измеряет, насколько сложно гонщику доставить еду, включая все время с момента прибытия гонщика к зданию пользователя до момента доставки еды пользователю.
Измерение времени доставки — очень сложная вещь, потому что пассажиры будут сталкиваться с разными проблемами при доставке еды пользователям, например, курьеры доставят еду нескольким пользователям в здании одновременно, а пассажиры имеют специальную адресацию для конкретного здания. , всадники могут ходить только возле доставленного здания, в старом сообществе нет лифта, офисное здание не может подняться наверх, или трудно дождаться лифта и т. д. Оценка времени доставки требует способности характеризовать сложность доставки и широко используется в различных сценариях, таких как ценообразование и планирование. Например, определяется, корректировать ли почтовые расходы пассажира в соответствии с трудностями доставки и корректировать ли порядок накладной доставки в соответствии с трудностями доставки, чтобы избежать сверхурочной работы и т.д. В целом, оценка времени доставки является важной частью основных услуг дистрибьюторского бизнеса.
Однако оценка времени доставки имеет следующие трудности:
- Входной информации меньше, и большинство из них представляют собой нечисловые данные.В настоящее время для оценки могут использоваться только следующие размерные признаки: адрес доставки, долгота и широта точки доставки, регион, город и адаптация к обычному машинному обучению. модели нужно переставлять и легко теряется информация.
- Требования к производительности вычислений высоки. Поскольку это базовая служба, ее будет вызывать большое количество служб, и производительность TP99 должна быть гарантирована в пределах 10 мс, а среднее время отклика всего алгоритма должно контролироваться в пределах 5 мс, включая обработку данных и время РПК. И этот стандарт является требованием производительности в среде ЦП, а не требованием производительности в графическом процессоре.
Подводя итог, можно сказать, что проблема с оценкой времени доставки заключается в необходимости использовать легковесное решение для обработки нечисловых данных в различных формах данных, извлечения эффективной информации и получения относительно точных результатов. Исходя из того же эффекта, мы предпочитаем решение с большей производительностью.
В этой статье мы представляем три версии итераций оценки времени доставки, а именно древовидную модель на основе адресной структуры, схему векторного отзыва и облегченную сквозную сеть глубокого обучения. В то же время он рассказывает о том, как выбирать между производительностью и показателями, а также о промежуточном процессе итерации стратегии модели, надеясь вдохновить и помочь студентам, которые занимаются смежной работой.
2. Путь итерации технологии
Прежде всего, в технической итерации оценки времени доставки мы в основном испытали три основных изменения версии.Каждая версия преследует облегченное решение с ограничением вычислительной производительности 5 мс.Значительно повышенное потребление производительности.
В этой главе описываются итерационные пути трех моделей, включая технический выбор, ключевые решения и окончательные результаты.
2.1 Модель дерева
Технический отбор
Самым ранним и простым для рассмотрения является использование правил.Основная идея состоит в том, чтобы использовать древовидную структуру для измерения сходства адресов, максимально накапливать структурированные данные о похожих адресах доставки, а затем использовать стратегии локальной регрессии для получения относительно богатой логики регрессии. А те, кто не соответствует требованиям стратегии регрессии, уйдут на дно стратегии.
Для быстрого накопления локальных данных более подходящим решением является древовидная модель.Правила парсинга дерева позволяют эффективно агрегировать данные.В то же время неглубокое дерево имеет достаточно преимуществ по скорости вычислений и может быть был использован за короткое время. Со временем было получено относительно хорошее решение.
Наблюдая за иерархической структурой адресов, заполняемых пользователями, и связываясь с фактическими адресами, нетрудно обнаружить, что адрес может состоять из четырехуровневых структур: основных слов адреса (addr), номера здания (здания), номера подразделения (unit ), и пол (этаж). Основы адресов могут фактически соответствовать названиям достопримечательностей, таким как названия сообществ или названия школ. Например, Wangjing Garden, Building 1, Unit 2, Floor 5 разрешается как (Wangjing Garden, Building 1, Unit 2, Floor 5). Благодаря анализу фактическое время доставки положительно коррелирует с высотой этажа, а время доставки по разным адресам доставки зависит от увеличения этажа.Поэтому можно использовать модель линейной регрессии, чтобы установить взаимосвязь между информацией об этаже. и время доставки, а также адресное слово, номер здания, номер единицы в качестве индекса его уровня. Однако адрес, введенный пользователем, не обязательно содержит полную четверичную структуру, и будет определенная доля отсутствующих, поэтому используйте такую иерархическую структуру для построения дерева, а затем в полной мере используйте известную информацию адресата. предыдущий слой для оценки. При прогнозировании нужно только найти соответствующую модель по ветви узла, если она отсутствует, использовать предыдущую структуру для прогноза. Для адресов, которые не соответствуют объему данных, требуемому моделью обучения, в качестве предполагаемого времени доставки используется среднее время доставки в регионе, где находится адрес, Эту часть также можно рассматривать как информацию о регионе как корневой узел структура дерева.
итерировать путь
Общая идея состоит в том, чтобы обучить древовидную модель на основе дискретных функций и обучить модель линейной регрессии на основе этажей в узлах дерева. Правила разделения обучающих узлов дерева: (1) количество данных больше порогового значения; (2) сумма MAE (средняя абсолютная ошибка) после разделения меньше, чем до разделения. Учитывая своевременность данных, для увеличения веса последних данных использовалась взвешенная линейная регрессия.
2.2 Модель дерева + схема векторного вызова
Технический отбор
Как одна из основных схем отзыва, векторный отзыв широко используется в отрасли.Основываясь на использовании распространенных инструментов с открытым исходным кодом, таких как квантование произведения LSH и PQ, производительность отзыва многомерных векторов обычно составляет порядка миллисекунд.
С точки зрения алгоритма, только 70%+ результатов разрешения адресов NLP в древовидной модели могут соответствовать требованиям использования модели, а оставшиеся 20%+ адресов не могут пройти обучающую модель и могут только ухудшиться. Используйте многомерные векторы для выражения семантического сходства, то есть используйте векторы для выражения сходства адресов, чтобы заменить похожие, но не вызванные данные моделью, соответствующей похожим данным, и внедрить слова основы адреса, чтобы избавиться от нижней основы. слова, которые полностью соответствуют надежности.
Например, может быть случай, когда объема данных [7Days Inn Jinyang Street Store] достаточно, но объема данных [7Days Inn Taiyuan High-tech Zone Jinyang Street Store] недостаточно для обучения модели. одно и то же место доставки. Мы хотим максимизировать успешность геокодирования.
итерировать путь
Весь технический путь относительно ясен и прост, то есть использование Word2Vec для встраивания символов charLevel для получения векторного представления адреса и интеграции информации о местоположении GPS для разработки соответствующей итоговой стратегии.
окончательный эффект
Скорость отзыва общей стратегии значительно улучшилась на 12,20 п. п. Для адресов, которые не были отозваны предыдущей версией древовидной модели, показатели значительно улучшились: ME уменьшился на 87,14 с, MAE уменьшился на 38,13 с, абсолютная скорость отклонения уменьшилась на 1 мин., малая 14,01 п.п., 2-минутная скорость абсолютного отклонения уменьшилась на 18,45 п.п., 3-минутная скорость абсолютного отклонения уменьшилась на 15,90 п.п.
2.3 Комплексное облегченное решение для глубокого обучения
Технический отбор
На основе древовидной модели, переходящей к векторной схеме отзыва, скорость отзыва всей модели значительно увеличилась, но она все еще не 100%. Анализ показал, что препятствием для улучшения скорости отзыва является охват НЛП для разрешения адресов.
Отправная точка всей программы:
Учитывая сложность модели, если используется только адресная информация, на основе улучшения измерения VC модели использование других модельных решений может, по крайней мере, сохранить эффект древовидной модели.Если другая информация может быть интегрирована на этой основе, то для исходной модели Базовый уровень может быть дополнительно улучшен.
Принимая во внимание необходимость использования не только адресных данных, но и данных GPS и большого количества вложений ID-типа, учитывая гибкость обработки различных нечисловых типов, принято решение для глубокого обучения, чтобы гарантировать, что мульти-источник и мульти- функции типов могут обрабатываться одновременно Оптимизация обучения в системе оптимизации.
Моменты, которые следует учитывать при проектировании:
В качестве базовой модели модель доставки широко используется в различных сервисах, таких как построение пути, ценообразование и ETA.Производительность бизнеса не может значительно увеличить время вычислений.
Сложность доставки модели заключается в том, что существует множество нечисловых признаков и диверсификация форм получения информации Текущим узким местом является не низкая сложность модели. Если информацию и слияние можно получить легко, нет необходимости делать более тяжелую схему обработки информации после слияния.
Таким образом, общая идея дизайна такова: используйте глубокое обучение для интеграции нечисловых функций и непосредственного получения выходной структуры на основе простого Fusion.Для выбора компонентов выберите дизайн с максимально низким Flops. Целью разработки является полное использование исходной входной информации и включение нечисловой информации на основе максимально возможного предотвращения потери информации. И полностью интегрируйте информацию, чтобы напрямую подключиться к требуемым целям. Выбранная структура компонента Fusion обеспечивает максимально высокую производительность и обладает высокой эффективностью обучения. Здесь для адреса выбирается более надежный LSTM, а для GPS выбирается пользовательское билинейное встраивание с учетом производительности и эффекта.
итерировать путь
Начните использовать сквозную модель глубокого обучения, первое, что нужно решить здесь, — это проблема покрытия, напрямую использовать LSTM для чтения адресных данных charLevel и напрямую выводить время доставки через полный уровень соединения. Как и данные первой версии, данные этой версии в основном такие же, как эффект древовидной модели, но для 20% данных, которые не вызываются древовидной моделью, наблюдается большое улучшение.
После использования адреса charLevel для работы мы начали использовать информацию о добавлении адреса пользователя GPS.Поскольку GPS представляет собой информацию о широте и долготе и нечисловые данные, мы используем метод билинейной интерполяции, основанный на точках сетки географического положения для встраивания. Схема обладает определенной масштабируемостью, может разумно получать вектор встраивания для разных GPS, и в то же время имеет плавные характеристики, которые вполне могут поддерживать несколько пар точек GPS с небольшими смещениями.
В окончательном решении после внедрения адреса и точки GPS, а также после добавления времени заказа, идентификатора города, идентификатора области и других функций выполняется слияние и преобразование функций для получения оценки времени на выходе модели доставки. . Вся модель представляет собой сквозное обучение, и все параметры доступны для обучения.
Компоненты расширения
Убедившись, что сквозной путь осуществим, мы начали создавать компоненты расширения, в том числе пользовательские функции потерь, коррекцию выборки данных, унификацию национальной модели и т. д., и получили ряд положительных эффектов, которые были разработаны и запущены.
Анализ важности функций
Для моделей глубокого обучения у нас есть ряд схем оценки важности функций, Здесь метод последовательного выполнения перестановки функций используется как способ оценки важности функций модели.
Учитывая, что существует большая степень перекрытия информации между широтой и долготой GPS и адресом пользователя, результаты оценки следующие. После случайного воспроизведения важность адреса пользователя выше, чем широта и долгота GPS. После добавления GPS снижение МЭ не столь очевидно, как снижение адресной информации, в основном потому, что адресная информация содержит некоторую избыточную информацию (будет проанализирована ниже), а влияние другой информации можно не учитывать.
особенность | Рейтинг важности функции |
---|---|
Адрес пользователя | 1 |
GPS широта и долгота | 2 |
Другие особенности | ...... |
Примечание. В других случаях доставки важность широты и долготы GPS продавца >> важность адреса пользователя >> важность широты и долготы GPS пользователя, важность функции находится только в порядке важности функции в этом случае, под разными целями обучения могут быть разные цели обучения относительно очевидная разница.
окончательный эффект
Конечный эффект модели глубокого обучения End-to-End более значителен: для наиболее болезненной точки модели дерева и схемы векторного отзыва степень покрытия полностью решается, а степень покрытия увеличивается до 100%. ME уменьшилась на 4,96 с, MAE уменьшилась на 8,17 с, 1-минутная абсолютная скорость отклонения уменьшилась на 2,38 пп, 2-минутная абсолютная скорость отклонения уменьшилась на 5,08 пп, 3-минутная абсолютная скорость отклонения уменьшилась на 3,46 пп. В то же время улучшение еще более очевидно для накладных, которые не были охвачены предыдущей древовидной моделью и схемой векторного отзыва.
3. Модельный корреляционный анализ
В течение всего процесса технической итерации, поскольку все решение имеет строгие требования к производительности, необходимо анализировать производительность решения отдельно. В этой главе проводится соответствующий анализ производительности схемы векторного отзыва и схемы глубокого обучения, чтобы подтвердить индикаторы производительности в автономном режиме и, наконец, убедиться, что производительность соответствует требованиям после перехода в онлайн. В следующем разделе основное внимание уделяется выбору инструмента сопоставления векторов Faiss и оператора TensorFlow Operation, а также влиянию на общую производительность.
В то же время сравнение разницы в качестве вектора, сгенерированного End-to-End, и вектора, сгенерированного Word2Vec, имеет определенное эталонное значение для связанных проектов.
3.1 Производительность векторного отзыва
Поиск ближайшего соседа относится к проблеме поиска ближайшей точки к точке запроса в многомерном пространстве. Когда выборка данных мала, линейный поиск может удовлетворить спрос, но по мере увеличения объема данных, например, когда он достигает миллионов или сотен миллионов точек, он имеет тенденцию более точно выражать векторную информацию посредством структурированного представления данные.
В настоящее время приблизительный поиск ближайшего соседа ANN (приблизительный ближайший сосед) является эталонной технологией, которая может выполнять линейный поиск после приблизительного вызова части, чтобы сбалансировать эффективность и точность. В настоящее время, как правило, существуют следующие три основных метода: методы на основе дерева, такие как дерево K-D и т. д.; методы на основе хэшей, такие как LSH; методы, основанные на векторном квантовании, такие как квантование произведения PQ. В промышленных поисковых системах количественная оценка продукта является широко используемым методом индексации.
Существует большое количество реализаций с открытым исходным кодом для инструментов векторного отзыва.В процессе выбора технологии мы обращаемся кANN-Benchmarksа такжеErikbern/ANN-BenchmarksРезультатом оценки производительности является . Среди множества наборов инструментов, связанных с ИНС, с учетом таких факторов, как производительность, память, точность отзыва и т. д., которые могут поддерживать GPU, при тестировании схемы векторного отзыва в качестве эталона выбран Faiss.
Faiss — это библиотека с открытым исходным кодом, открытая FaceBook в 2017 году для эффективного поиска сходства в плотных векторах и плотной кластеризации векторов, которая может сочетать скорость и точность для заданного использования памяти. Предоставляя множество методов поиска, он имеет несколько интерфейсов, таких как C++/Python, а также поддерживает реализацию большинства алгоритмов на графическом процессоре.
На следующем рисунке показана кривая оценки Файсса:
Тест производительности отзыва модели времени доставки выглядит следующим образом, что может соответствовать требованиям производительности.
- Количество наборов кандидатов на отзыв: векторы 8W [Поскольку расстояние GPS используется в качестве предела расстояния, тест отзыва использует порядок величины 8W]
- Тестовая машина: собственный ЦП Mac [ЦП уже соответствует производительности, поэтому тестирование графического процессора больше не требуется]
3.2 Производительность модуля последовательности
В системе TensorFlow с C API в качестве границы система делится на две подсистемы: [front-end] и [back-end], фронтенд играет роль клиента, завершает построение вычислительного графа , а затем Protobuf отправляет его на серверную часть, чтобы начать вычисление вычислительного графа. Базовой единицей вычислительного графа является ОП, который представляет собой абстракцию некоторой операции. В TensorFlow, учитывая разные реализации, выбор разных операторов OP оказывает большое влияние на производительность вычислений.
Чтобы оценить узкое место производительности модели доставки глубокого обучения, сначала профилируйте всю модель. На следующем рисунке показана временная шкала после профиля. Большая часть всех расчетов выполняется в части обработки модуля последовательности, то есть в синяя часть на рисунке ниже. Следовательно, производительность вычислений модуля последовательности должна быть ускорена оператором OP.
Учитывая потребности обработки последовательности, для оценки используются такие модули, как LSTM/GRU/SRU.В то же время в TensorFlow LSTM также имеет различные формы реализации, включая BasicLSTMCell, LSTMCell, LSTMBlockCell, LSTMBlockFusedCell и CuDNNLSTM.На ЦП, CuDNNLSTM исключается, а полносвязный слой FullyConnect настроен на присоединение к оценке.
Из оценки видно, что полносвязный уровень является самым быстрым, но теряет 2,3 п.п. при обработке последовательности.Остальные модели последовательности имеют небольшую разницу в эффекте, но разные реализации OP оказывают большее влияние на результаты. Нативный BasicLSTM имеет низкую производительность, LSTMBlockFusedCell под contrib имеет лучшую производительность, а GRU/SRU не дает значительных преимуществ в этом сценарии.
Это официальное описание LSTMBlockFusedCell. Его основная реализация заключается в объединении цикла LSTM в OP. При вызове вся временная шкала становится более компактной, при этом экономя время и память:
This is an extremely efficient LSTM implementation, that uses a single TF op for the entire LSTM. It should be both faster and more memory-efficient than LSTMBlockCell defined above.
Вот тест производительности модуля sequence:
- Среда: Tensorflow1.10.0, CentOS 7.
- Метод тестирования: вывод ЦП 1000 раз, взять самую длинную последовательность адресов и вычислить среднее время.
- Вывод: LSTMBlockFused обеспечивает наилучшую производительность. [FullyConnect имеет самую высокую производительность, но есть потеря производительности]
Примечание. В оценку включена не только модель последовательности, но и другие функциональные модули, поэтому количество параметров и размер модели основаны на общей модели.
структура lstm OP | время (мс) | FLOPs | Количество обучаемых параметров | Размер модели (МБ) | разница в эффекте |
---|---|---|---|---|---|
Fully Connect | 1.18 | 27.83M | 7.00M | 29.1 | -2.3pp |
SRU | 4.00 | 27.96M | 7.06M | 29.4 | нет явно отличается |
GRU Block | 3.64 | 28.02M | 7.10M | 29.6 | нет явно отличается |
GRU | 4.44 | 28.02M | 7.10M | 29.6 | нет явно отличается |
LSTMBlockFused | 2.48 | 28.09M | 7.13M | 29.7 | нет явно отличается |
LSTM Block | 4.34 | 28.09M | 7.13M | 29.7 | нет явно отличается |
LSTM | 4.85 | 28.09M | 7.13M | 29.7 | нет явно отличается |
BasicLSTM | 4.92 | 28.09M | 7.13M | 29.7 | нет явно отличается |
3.3 Анализ векторного эффекта
Воспроизведение вектора сравнивается по горизонтали с моделью глубокого обучения, и в середине двух процессов генерируются многомерные векторы. Нетрудно обнаружить, что у них есть определенное сходство, которое натолкнуло нас на размышления:
По сравнению с векторным отзывом, откуда в основном происходит улучшение, обеспечиваемое моделью глубокого обучения?
Насколько велика разница между вектором встраивания, полученным контролируемым lstm, и вектором, полученным самоконтролируемым Word2Vec при вычислении схожести адресов, что лучше?
Во-первых, мы анализируем первый вопрос, откуда в основном происходит сквозное улучшение модели?
ME | MAE | 1-минутная абсолютная скорость отклонения | 2-минутная абсолютная скорость отклонения | 3-минутная скорость абсолютного отклонения | |
---|---|---|---|---|---|
Сквозная модель — модель Word2Vec | 4.14 | -0.45 | -0.31% | 0.05% | -0.41% |
Мы напрямую извлекаем вложение символов, полученное с помощью модели End-to-End, помещаем его непосредственно в схему Word2Vec, заменяем вложение символов, сгенерированное Word2Vec, а затем оцениваем отзыв вектора. Результаты показаны в следующей таблице.Производительность встраивания отдельно извлеченных символов в схему векторного отзыва в основном такая же, как и у вектора, сгенерированного Word2Vec, и нет очевидного преимущества.
Примечание:
- 1-минутное определение скорости абсолютного отклонения: |предварительная метка|
- 2-минутное определение скорости абсолютного отклонения: |предварительная метка|
- 3-минутное определение скорости абсолютного отклонения: |предварительная метка|
Переменные в настоящее время имеют два аспекта:
-
а) Структура обучения адреса charLevel отличается, одна — Word2Vec, а другая — LSTM.
-
b) Входная информация отличается.Ввод информации Word2Vec представляет собой только основное слово адреса, в то время как вход сквозной информации включает в себя основное слово адреса, вспомогательную информацию адреса, GPS и другую информацию.
Примечание:
- Полный адрес: Dolma Skin Care Modeling (Dongting Lake Store) (Dorma Skin Care Modeling на пересечении улиц Dongting Lake Road и Tianshan Road)
- Ключевые слова адреса: Магазин стайлинга по уходу за кожей Dolma.
- Адресная информация: (Dongting Lake Store) (Dongting Lake Road и Tianshan Road, пересечение Zhuoma, моделирование ухода за кожей)
Чтобы исключить второй фактор, т. е. фактор b, в качестве входных данных вместо вспомогательной адресной информации и других структур модели используется слово основы адреса, а входные данные модели поддерживаются в соответствии с Word2Vec. На тестовом наборе эффект модели значительно ниже, чем у полного адреса, а MAE увеличивается примерно на 15 с. В то же время встраивание символов извлекается для замены встраивания символов схемы Word2Vec, и эффект хуже. В сочетании с важностью функций в разделе 2.3 можно увидеть, что улучшение, вызванное моделью глубокого обучения, в основном связано с использованием избыточной информации в адресах (по сравнению с векторным отзывом), за которым следует добавление нескольких новых функций. Кроме того, сравнивая эффекты двух сквозных моделей, вспомогательная информация об адресе также содержит полезную информацию для сопоставления адресов.
ME | MAE | 1-минутная абсолютная скорость отклонения | 2-минутная абсолютная скорость отклонения | 3-минутная скорость абсолютного отклонения | |
---|---|---|---|---|---|
Сквозная модель — модель Word2Vec | -1.28 | 0.64 | 0.90% | 0.85% | 0.35% |
Что касается второго вопроса, насколько велика разница между вектором внедрения, полученным контролируемым End-to-End, и вектором, полученным самоконтролируемым Word2Vec при вычислении схожести адресов, что лучше?
Основное слово адреса используется вместо полного адреса, который используется в качестве входных данных сквозной модели для обучения, а остальная информация остается неизменной. Вектор встраивания, полученный с помощью обучения слов адресной основы, применяется к схеме отзыва вектора.
По результатам оценки для различных пороговых значений разница в производительности End-to-End меньше, чем у Word2Vec. При том же пороге скорость сквозного отзыва выше, но эффект не так хорош, как у Word2Vec.
Исходя из аналогичных результатов вычислений, сквозная модель сопоставляет некоторые адреса, которые не связаны семантически, но имеют одинаковое время доставки, с одним и тем же векторным пространством, в то время как Word2Vec изучает более общее текстовое векторное представление.
Например, следующие два адреса доставки будут считаться имеющими одинаковое векторное расстояние, но на самом деле имеют только одинаковое время доставки: Конгресс Jinchangsheng на пересечении South Inner Ring West Street и Xiyuan South Road.
Если вы хотите ориентироваться на более сложные цели и вводить больше информации, вы можете использовать сквозную структуру; просто вычислите сходство текста, исходя из экспериментальных результатов, Word2Vec лучше. В то же время, взглянув на Case, можно обнаружить, что End-to-End больше внимания уделяет сходству результатов, тем самым вспоминая некоторые семантически нерелевантные векторы. Различия в целях двух моделей приводят к различиям в результатах.
4. Резюме и перспективы
В этой статье поочередно показаны три процесса итерации стратегии модели в сценарии доставки и доставки, а также показано, как использовать упрощенное решение для постоянного улучшения скорости отзыва и эффекта в условиях более строгих требований к производительности. При этом производительность в итеративном процессе просто анализируется и измеряется, что также имеет определенное эталонное значение для смежных проектов Наконец, сравниваются векторы, сгенерированные Word2Vec и End-to-End.
Фактически, упомянутое в этой статье решение векторного отзыва и глубокого обучения слияния нечисловых признаков широко используется в отрасли. Тем не менее, для дифференцированных сценариев эта статья по-прежнему имеет определенное справочное значение, особенно для основанных на сценариях приложений в полях рекомендаций, не связанных с поиском, таких как сопоставление заказов и заказов, а также выбор и анализ операторов OP TF. , и метод генерации встраивания, Я надеюсь, что он может дать вам некоторые идеи и вдохновение.
5. Связанное чтение
Оценка времени доставки и оценка ETA и другие деловые отношения доставки:
- Оценка времени доставки является важной частью оценки ETA. Для оценки ETA, пожалуйста, обратитесь к 《Исследование и практика глубокого обучения в оценке ETA доставки Meituan".
- Конкретное положение ETA во всем дистрибьюторском бизнесе и общую практику машинного обучения в дистрибьюторском бизнесе см. в разделе "Практика машинного обучения в системе дистрибуции Meituan: восстановление реального мира с помощью технологий".
6. Об авторе
- Цзи Зе, технический эксперт Meituan Dianping
- Ян Цун, инженер-алгоритмист Meituan Dianping
7. Информация о наборе
Команда искусственного интеллекта доставки Meituan поддерживает ведущую в мире сеть мгновенной доставки Meituan Delivery и создала ведущую в отрасли интеллектуальную систему доставки Meituan. Команда Meituan по доставке AI в основном состоит из ведущих интернет-компаний и известных научно-исследовательских институтов, с превосходной силой и атмосферой исследований и разработок. В настоящее время бизнес доставки Meituan все еще находится в периоде быстрого развития, появляются новые сценарии и новые технические проблемы, и есть огромные возможности для роста.
Команда ИИ Meituan Delivery в настоящее время ищет инженеров по стратегии алгоритмов, инженеров по машинному обучению и инженеров по оптимизации исследований операций.