Оперативная оптимизация интеллектуальной системы распределения

Углубление в различные отрасли стало основным направлением Интернета в настоящее время.Существует большое количество сложных бизнес-ограничений и различных переменных решений онлайн и офлайн, что дает место для технологии оптимизации исследования операций. Каким образом оптимизация операций реализуется в различных бизнес-сценариях Meituan, являясь одной из основных технологий интеллектуальной системы распределения Meituan? Эта статья основана на содержании речи, произнесенной Ван Шэньяо, старшим экспертом по алгоритмам группы технологий распределения Meituan, на конференции ArchSummit Global Architect Summit 2019 в Пекине.

Архитектура интеллектуальной системы распределения Meituan

Бизнес-сценарии доставки Meituan сложны, а объем заказов велик. Набор чисел на рисунке ниже — это данные, когда бренд доставки Meituan был выпущен в мае 2019 года.

Более интуитивным масштабом может быть зарплата, которую Meituan платит гонщикам каждый год, и которая сейчас достигла порядка десятков миллиардов. Следовательно, в таком крупномасштабном бизнес-сценарии интеллектуальное распределение становится очень важным, а ядром интеллектуального распределения является оптимизация распределения ресурсов.

资源优化配置

Доставка еды — типичный сценарий O2O. Есть как онлайн бизнес, так и оффлайн сложные операции. Выполнение связывает спрос на заказ с предложением мощности. Чтобы достичь баланса между спросом и предложением, необходимо не только управлять продавцами и райдерами в автономном режиме, но и разумно настраивать этот спрос и предложение мощности в Интернете с целью повышения общей эффективности. Только максимизируя эффективность дистрибуции, мы можем обеспечить хорошее качество обслуживания клиентов и снизить затраты на дистрибуцию. Процесс оптимизации распределения ресурсов фактически является многоуровневым. Согласно нашему пониманию, его можно разделить на три слоя:

Базовым слоем является структурная оптимизация, непосредственно определяющая верхний предел эффективности системы распределения. Оптимизация этой инфраструктуры имеет относительно длительный период и относительно низкую частоту, включая планирование распределительной сети, планирование структуры мощностей и так далее.
Средний уровень — это корректировка рынка, которая является относительно краткосрочной и среднесрочной, в основном с помощью методов ценообразования или маркетинга, так что спрос и предложение могут достичь относительно идеального баланса.
Верхний уровень — это сопоставление в реальном времени, а оптимальное сопоставление ресурсов в реальном времени осуществляется посредством планирования. Частота сопоставления в реальном времени самая высокая, а цикл принятия решения также самый короткий.

智能配送系统架构

В соответствии с трехуровневой системой интеллектуального распределения команда алгоритмов распределения также выполняла целевые операции. Как показано на рисунке выше, три подсистемы справа соответствуют трехуровневой системе: нижний уровень — это система планирования, средний уровень — это система ценообразования, а верхний уровень — это система планирования. Также очень важно включить на рисунок остальные четыре подсистемы, которые выполняют точный сбор, восприятие и оценку данных в процессе распределения и обеспечивают ввод точных параметров для оптимального принятия решений, включая системы машинного обучения, IoT и системы восприятия. , и системы LBS, Это очень важная часть системы распределения, связанная с множеством сложных задач машинного обучения.

Оптимизация операционных исследований является основной технологией системы планирования, системы ценообразования и системы планирования. Далее мы поделимся несколькими типичными случаями оптимизации операционных исследований.

Практические бизнес-проекты

Умное региональное планирование

Чтобы помочь вам быстро понять основы дистрибьюторского бизнеса, здесь мы сначала расскажем об общих проблемах и их решениях в проектах умного регионального планирования.

配送网络基本概念

Доставка соединяет три стороны: продавцов, клиентов и пассажиров, а сеть дистрибуции определяет связь между этими тремя сторонами. Когда пользователь открывает приложение, он видит, у каких продавцов можно заказывать еду, что определяется диапазоном доставки продавца. Объем распределения каждого продавца различен, что кажется решением гранулярности продавца, но на самом деле это напрямую влияет на предложение бизнес-потоков, получаемое каждым C-конечным пользователем, что также является проблемой распределения ресурсов или захвата ресурсов. . Интеллектуализация диапазона распределения торговцев также является задачей комбинаторной оптимизации, но здесь речь идет о связи между торговцами и наездниками.

Кто этот райдер, который обслуживает пользователя, когда он заказывает еду на вынос в Meituan? Как это определяется? Они определяются границами зоны доставки. Граница области доставки относится к диапазону, соответствующему некоторым коллекциям продавца. Зачем демаркировать региональные границы? С точки зрения оптимизации для детерминированной задачи чем меньше ограничений, тем больше вероятность того, что значение целевой функции будет лучше. Студенты, занимающиеся оптимизацией, определенно не любят ограничений, но граница области распределения на самом деле является ограничением, накладываемым на систему распределения.

В традиционной логистике наиболее важным моментом, влияющим на эффективность терминальной доставки, является знание доставщиком области, за которую он отвечает. Это также одна из причин, по которой в традиционной сфере логистики распределительные станции или распределительный персонал всегда отвечают за определенные сообщества. Потому что чем привычнее он будет, тем выше будет эффективность доставки.

Сценарий мгновенной доставки аналогичен, и каждому гонщику необходимо как можно чаще знакомиться с продавцом или зоной доставки. В то же время для руководства область управления сайтом также относительно ясна. Кроме того, если новый продавец выходит в сеть, легко определить, какая станция доставки будет предоставлять услугу. Поэтому к оперативному управлению в этом вопросе предъявляется много требований.

区域规划影响配送效率

Конечно, есть много проблем, которые необходимо решить при инициировании проектов регионального планирования. В основном это включает в себя следующие три ситуации:

Продавцы в зоне доставки не агрегируются. Это типичное место. Торговцы в основном сосредоточены в нижнем левом и верхнем правом углах, что приводит к географическому положению всадников, выполняющих задачи по сбору и доставке еды в этом районе. Необходимо постоянно перемещаться между два деловых района, и есть много неэффективных работ.
Площадь странной формы, и пустое вождение серьезное. В процессе развития онлайн-платформ доставки еды в магазины во многих местах не было продавцов, а позже, когда больше продавцов ушло в онлайн, они использовались как отдельная зона доставки. Такая область может иметь неправильную форму, из-за чего всадник большую часть времени выбегает за пределы этой области. У продавцов и всадников есть обязательные отношения, и всадники могут обслуживать торговцев только в своей области, поэтому всадники не могут получать заказы за пределами зоны доставки, а скорость порожнего вождения очень высока. Во многих случаях после того, как всадник доставил еду, ему приходится бежать обратно пустым, чтобы получить новое задание.
Размер сайта не соответствует действительности. Рисунок 3. На этом сайте всего одна-две сотни заказов в день. Если вы настраиваете райдеры с точки зрения среднего объема райдеров, вы можете настроить только 3–4 райдера. Если один или два человека внезапно должны будут попросить отпуск, вполне возможно, что опыт доставки сайта станет очень плохим, а работа и управление будут очень сложными. И наоборот, если какая-то станция становится очень большой, начальник станции не может управлять таким количеством пассажиров, что также является проблемой. Поэтому необходимо планировать разумную однотомную шкалу для каждого сайта.

Поскольку проблем так много, становится очень необходимым сделать проект регионального планирования. Итак, что такое хорошее решение для регионального планирования? Постановка целей оптимизации на основе статистического анализа.

多目标优化问题

Три элемента оптимизации: цели, ограничения и переменные решения.

Первый момент заключается в том, чтобы сначала определить цель оптимизации. Во многих относительно стабильных или традиционных бизнес-сценариях цель очень определенна. Как определить цели оптимизации в сценарии регионального планирования? Прежде всего, нам нужно подумать о том, каково основное влияние регионального планирования. Из анализа нескольких типов задач можно обнаружить, что основное влияние оказывает плавность хода гонщика и скорость порожнего вождения, то есть средняя стоимость проезда, которую платит гонщик за каждый заказ. Итак, мы поставили бизнес-цель задачи оптимизировать среднее расстояние, пройденное гонщиком. На основе имеющихся данных, накопленных в большом количестве регионов и площадок, после большого статистического анализа можно определить следующие показатели: степень агрегации мерчантов, степень агрегации заказов, степень отклонения между центром тяжести заказов и центра тяжести торговцев. Результаты анализа данных показывают, что эти показатели имеют сильную корреляцию со средним расстоянием вождения. После этого уровня трансформации моделирования проблема явно состоит в том, чтобы оптимизировать эти три показателя.

Второй момент заключается в том, что бизнес-ограничения должны быть устранены. Мы тратим на это много времени и сил. Например: существует верхний и нижний предел объема регионального заказа; между регионами не может быть пересечений, и ни один продавец не несет ответственности за несколько регионов; все AOI не могут быть опущены и должны быть охвачены определенным регионом, а также не могут быть услугами, для которых у продавцов нет сайта.

Объединение ограничений на основе бизнес-сценариев

Одна из самых сложных проблем заключается в том, что границы регионов должны проходить по дорожной сети. Поначалу нам было трудно понять, потому что по сути региональное планирование — это только классификация предприятий, это просто концепция сбора бизнеса, зачем проводить границу, да еще и требовать, чтобы граница проходила по дорожной сети? На самом деле, как я только что представил, региональная граница должна ответить на вопрос, с какого сайта новый продавец должен выходить в интернет. Кроме того, с точки зрения затрат на управление на переднем крае, он более привычн к выражению того, какая дорога идет на восток, а какая на юг, что легко запомнить и понять и повысить эффективность управления. Поэтому при таком спросе мы надеемся, что региональные границы более «понятны».

整体方案设计

После определения целей и ограничений общее техническое решение делится на три части:

Сначала по трем целевым функциям определить оптимальный набор торговцев. Этот шаг относительно прост, и студенты, занимающиеся оптимизацией исследования операций, могут быстро решить такую многокритериальную задачу комбинаторной оптимизации.
Последние шаги сложнее, как нарисовать границу области? Чтобы решить эту проблему, команда доставки сотрудничала с командой карты Meituan. Сначала с помощью информации о дорожной сети город разбивается на несколько непересекающихся полигонов, а затем в соответствии с расчетной геометрией полигоны, соответствующие группе предприятий, собираются в полную границу района.
Наконец, используйте систему моделирования распределения, независимо разработанную Meituan, чтобы оценить, соответствуют ли ожиданиям среднее расстояние вождения и показатели опыта, соответствующие такому региональному планированию. Поскольку стоимость прямых изменений линии очень высока, система моделирования играет очень важную роль.

Ниже приведен практический случай, мы использовали алгоритм для перепланировки города. Конечно, здесь необходимо подчеркнуть, что ручное вмешательство в этом процессе все же очень необходимо. Для некоторых угловых сцен, с которыми алгоритмам трудно справиться, требуется ручная тонкая настройка, чтобы сделать всю схему планирования более разумной. Средний график — результат планирования алгоритма. После пилота средняя пройденная дистанция по тестовому городу в целом уменьшилась на 5%, а средняя пройденная дистанция каждого гонщика была сохранена более чем на 100 метров. Можно предположить, что при таком огромном однотомном масштабе каждый заказ уменьшается в среднем на 100 м. Общее сэкономленное расстояние и сэкономленный заряд батареи — все это очень впечатляющие цифры. Что еще более важно, гонщик может ясно чувствовать, что его эффективность повысилась.

落地应用效果显著

Планирование умного водителя

бизнес фон

Это проект, основанный на все более и более продолжительных рабочих часах доставки еды на вынос. Если раньше еду на вынос подавали только с полуденного до вечернего пика, то позже все желающие могли заказать ужин и завтрак. К настоящему времени многие сайты доставки обеспечивают круглосуточное обслуживание. Однако райдеры не могут работать 24 часа в сутки, а трудовое законодательство также определяет рабочее время в сутки, поэтому этот проект просто необходим.

Кроме того, очень очевиден «эффект пика и долины» заказов в сценарии доставки на вынос. На картинке выше показана фактическая входящая одиночная кривая. Можно видеть, что в течение 24 часов в сутки объем заказов очень высок в дневные и вечерние часы пик, в то время как объем заказов относительно невелик в свободное время и поздно ночью. Поэтому система не может равномерно разделить 24 часа в сутки по часам работы каждого человека, и это тоже нужно планировать.

Для сменного графика существует два типа проблем выбора. Планирование многих предприятий основано на человеческом измерении.Преимущество заключается в том, что степень детализации конфигурации очень тонкая, а рабочее время каждого человека персонализировано, что может учитывать потребности каждого человека. Однако очевидны и недостатки сценария доставки. Если веб-мастеру нужно планировать рабочее время для каждого человека, сложность можно себе представить, и трудно обеспечить справедливость распределения.

排班方案选型

Команда доставки, наконец, выбрала метод планирования по группам, разделив всех гонщиков на несколько групп и указав период времени начала каждой группы. Затем люди могут чередоваться группами, и каждый получает свою очередь каждую смену.

Самая большая сложность этой проблемы заключается в том, что мы не делаем бизнес-инструмент, а разрабатываем алгоритм. И у алгоритма есть своя цель оптимизации, так какова же цель планирования? Если вы спросите у вебмастера, какая смена хороша, он может сказать только, что люди должны быть, когда их нужно трудоустроить. Но это не алгоритмический язык, не говоря уже о модельном языке.

决策变量及目标设计

Чтобы решить эту проблему, мы должны сначала разработать переменные решения.Переменные решения не выбирают время начала и окончания и время окончания смены.В этом случае пространство для принятия решений слишком велико. Мы дискретизировали время с точностью до получаса. В сутках всего 48 единиц времени, и пространство для принятия решений сильно сокращается. Затем цель состоит в том, чтобы иметь наибольшее количество единиц времени, в течение которых потребность в мощности соответствует объему заказа. Это связано с тем, что нет гарантии, что количество людей на станции сможет удовлетворить потребности вместимости каждого подразделения в соответствии с соответствующей кривой поступающих заказов. Итак, мы превращаем бизнес-ограничения в часть целевой функции. При этом есть еще одно преимущество, то есть нет необходимости знать общее количество людей на сайте.

На уровне моделирования наиболее предпочтительными являются стандартизированные и общие модели. Поэтому мы нормализуем количество людей, и алгоритм назначает долю райдеров в каждой смене вне зависимости от количества людей. В конце концов, вам нужно только ввести общее количество людей на станции, и вы получите количество людей в каждой смене. При принятии алгоритмических решений решается не количество людей, а только пропорция, так что единичное количество также можно нормализовать. Количество входящих заказов в единицу времени делится на количество заказов в единицу пикового времени дня, которое также становится числом от 0 до 1. Таким образом, можно считать, что если доля количества людей в определенную единицу времени больше, чем доля единичного количества, то вместимость удовлетворена. Таким образом, с помощью различных нормализации это становится общей проблемой, и ее не нужно решать отдельно для каждой сцены.

Кроме того, эта проблема включает в себя большое количество сложных жестких ограничений, связанных с различными требованиями управления и опытом гонщика. Ограничений много, например, каждый рабочий период должен быть как можно более непрерывным, продолжительность каждого рабочего периода не должна быть слишком короткой, время отдыха между разными рабочими периодами не должно быть слишком коротким и т. д. Таких бизнесов много Ограничений слишком много, и слишком сложно найти оптимальное решение или даже допустимое решение. Кроме того, когда веб-мастер использует инструмент планирования, он надеется сразу же дать план планирования системы, а затем быстро произвести последующую тонкую настройку, поэтому требования к времени работы алгоритма относительно высоки.

Основная идея алгоритма

基于约束条件的构造算法与局部搜索

Учитывая вышеперечисленные факторы, мы, наконец, строим исходную схему на основе ограничений и эвристического алгоритма, а затем используем итеративную оптимизацию локального поиска. Используя этот метод, скорость решения может достигать уровня миллисекунды, и может быть задан план планирования любой станции. Общий индекс оптимизации неплох, конечно, это не гарантировано оптимальное решение, но приемлемое удовлетворительное решение.

эффект применения посадки

Показатели опыта сайта хорошие, а прием первой линии высокий.
Экономия времени смены: 2 часа/каждый раз на станцию

Этот алгоритм также применялся в сценариях с автономным управлением.По сравнению с теми начальниками станций с богатым опытом планирования, эффект в основном такой же, а уровень приемлемости линии фронта относительно высок. Самое главное — сэкономить время планирования, которое каждый раз можно выполнять за несколько минут, чтобы у веб-мастера было больше времени для другой управленческой работы.

Планирование пути всадника

Применительно к проблеме планирования пути всадника это не простое планирование маршрута, не проблема выбора пути из пункта а в пункт б. Этот сценарий заключается в том, что у райдера есть много задач по доставке, и эти задачи доставки имеют различные ограничения Как выбрать оптимальный порядок доставки, чтобы выполнить все задачи. Это NP-сложная задача: при 5 заказах и 10 точках задач возможно более 110 000 заказов. В часы пик райдеры часто перевозят более 5 заказов, а иногда даже райдер получает более десятка заказов одновременно, в это время выполнимый заказ на вывоз и доставку становится астрономическим числом.

算法应用场景

Глядя на сценарий применения алгоритма, это самая важная часть интеллектуальной системы планирования. Диспетчеризация и перераспределение системы зависят от алгоритма планирования пути. Со стороны райдера порекомендуйте порядок выполнения задач для каждого райдера. Кроме того, после того, как пользователь закажет еду на вынос, Meituan в режиме реального времени покажет, что выполнение текущей задачи пассажира займет несколько минут, и предоставит пользователям более приблизительную информацию. При таком большом количестве сценариев приложений общая привлекательность заключается в том, что требования к своевременности очень высоки, и чем короче время работы алгоритма, тем лучше.

Но достаточно ли быстр алгоритм? Не совсем. Поскольку это основной модуль диспетчеризации и переназначения заказов, оптимизация и разрешающая способность алгоритма также очень важны. Если алгоритм планирования пути не может дать лучший путь, вполне возможно, что назначению и переназначению верхнего уровня будет трудно принимать лучшие решения.

Поэтому, чтобы прояснить этот вопрос, основное требование состоит в том, чтобы эффект оптимизации был стабильным и хорошим. Если в этот раз результат оптимизации будет плохим, в следующий раз он будет плохим. Кроме того, время работы должно быть коротким.

核心设计思想

При решении таких задач, как планирование пути, технические команды многих компаний прошли такой этап: сначала использовался алгоритм итеративного поиска, аналогичный генетическому алгоритму, но по мере увеличения количества бизнес-заказов выяснилось, что алгоритм оказался слишком трудоемким и принципиально неприемлемым. Затем он заменяется на крупномасштабный алгоритм поиска окрестности, но алгоритм по-прежнему имеет сильную случайность, потому что невозможно получить лучшее решение без случайности. Эта стратегия поиска, основанная на случайной итерации, приносит большую неопределенность, и в сценариях с большими масштабами проблемы будет много плохих случаев. Кроме того, итеративный поиск занимает слишком много времени. Основная причина заключается в том, что стохастический итерационный алгоритм рассматривает задачу комбинаторной оптимизации как простую задачу перестановки и редко использует структурные особенности задачи. Эти алгоритмы работают одинаково при решении TSP, при решении VRP и так же при решении планирования.Таким «безмозглым» методом трудно добиться отличного эффекта оптимизации.

Поэтому в данном проекте такой технический маршрут в принципе может быть определен. Во-первых, возможен только эвристический поиск направления, и в алгоритм нельзя добавлять случайные помехи. Нельзя допустить, чтобы одни и те же входные данные давали разные результаты оптимизации в разное время выполнения. Тогда обычный итерационный поиск не может быть использован, а должны быть раскопаны структурные характеристики этой проблемы, и должен быть выполнен специализированный поиск, основанный на знаниях.

Это легко сказать, но как мы это делаем? Мы считаем, что важнее всего точка зрения, с которой рассматривается проблема. Является ли проблема планирования пути здесь соответствующей классической моделью проблемы, проблемой TSP без обратной связи или вариантом VRP без обратной связи? Это может быть, а может и не быть. Мы сделали интересное преобразование моделирования и рассматриваем его как задачу конвейерного планирования: каждый заказ можно рассматривать как задание, а две задачи заказа можно рассматривать как операцию задания. Время прохождения между любыми двумя точками миссии можно рассматривать как время подготовки к корреляции последовательностей. Время доставки каждого заказа, включая предварительные заказы и мгновенные заказы, можно сопоставить с ранними и поздними штрафами в задачах планирования конвейера.

Эффект применения алгоритма

После выполнения такого преобразования моделирования появляется множество эвристик, которые можно использовать для справки в задаче планирования конвейера. Мы должным образом адаптировали и улучшили классический эвристический алгоритм, основанный на признаках задачи, и можем получить очень хорошие результаты. По сравнению с предыдущим алгоритмом затраты времени снижены на 70%, а эффект оптимизации хороший. Поскольку это детерминированный алгоритм, результат будет одинаковым независимо от того, сколько раз вы его запускаете. Наш алгоритм запускается один раз, а эффект оптимизации равен оптимальным результатам других алгоритмов, запускаемых 10 раз.

Умное планирование заказов

Сценарии планирования доставки могут быть описаны математическим языком. Это не только бизнес-задача, но и стандартная задача комбинаторной оптимизации и марковский процесс принятия решений.

调度问题的数学描述

Недостаточно произвести оптимальное размещение партии заказов в определенный момент, необходимо также учитывать всю размерность временного окна и влияние каждого задания на оборот. Каждое распределение заказа влияет на распределение позиций и направление движения каждого гонщика в последующий период. Если распределение и направление райдеров не подходят для будущей структуры заказа, это равносильно снижению потолка оптимальности последующих моментов планирования. Итак, рассмотрите оптимизацию с длинным циклом вместо задачи статической оптимизации.

问题简化分析

Для простоты понимания давайте сначала рассмотрим задачу статической оптимизации в определенный момент планирования. Это не просто алгоритмическая проблема, она также требует от нас очень глубокого понимания инженерной архитектуры. Потому что при дизассемблировании входных данных задачи обнаружится, что входные данные алгоритма слишком велики. Например, нам нужны данные навигационного расстояния для любых двух точек миссии.

Масштабы проблемы, с которой мы столкнулись в последние несколько лет, заключались только в детализации планирования в региональном измерении.Деловой район достиг пика в более чем 100 заказов в минуту, что соответствовало сотням пассажиров, но данные, соответствующие этому соотношению продуктов уже очень большой. Теперь, поскольку у Meituan больше бизнес-сценариев, таких как поручения и доставка по городу, он будет пересекать множество деловых районов, даже половину города, поэтому он может выполнять глобальную оптимизацию и сопоставление только на уровне города. В настоящее время пиковый масштаб задач, решаемых диспетчерской системой, составляет более 10 000 заказов и десятки тысяч райдеров. Алгоритм позволяет работать всего несколько секунд, при этом потребление памяти также очень велико.

Кроме того, сценарии доставки и онлайн-заказа автомобиля различны. Планирование такси должно соответствовать водителям и пассажирам. По сути, это проблема сопоставления двудольных графов. Существует оптимальный алгоритм за полиномиальное время: алгоритм КМ. Сложность сцены с такси заключается в том, как описать вес каждой пары спичек. Сценарий доставки все еще требует решения.В отсутствие полиномиального алгоритма оптимального времени, как получить оптимальное решение за короткое время в экспоненциальном пространстве решений. Если считать, что каждый матч и каждый гонщик имеют разную приспособленность, то эта приспособленность не является линейно аддитивной. Это означает, что в схеме сопоставления «мульти-один-множество» любое сопоставление может только повторно вычислить приспособленность, а количество вычислений можно представить.

Подводя итог, можно сказать, что эта проблема имеет три категории задач:

Требования к производительности чрезвычайно высоки, и необходимо добиться решения второго уровня 10 000 заказов на 10 000 человек. Ранее мы проделали интересную работу, например, использовали модели машинного обучения для сокращения на основе результатов исторических оптимальных назначений. Основываясь на большом количестве исторических данных, это может помочь нам сэкономить много бесполезных оценок схемы сопоставления.
динамичный. В качестве проблемы MDP необходимо рассматривать сценарии динамической оптимизации, которые включают большое количество оценочных связей. Когда есть только текущие невыполненные заказы, как выполняются райдеры, как оценить время выполнения каждого заказа, какая структура заказов будет размещена в будущем периоде и как это повлияет на бизнес-показатели и показатели эффективности... Вам может показаться, что это типичный сценарий обучения с подкреплением, но его трудность заключается в том, что пространство для принятия решений слишком велико, которое можно даже считать бесконечным. В настоящее время наша идея состоит в том, чтобы решить ее с помощью других средств моделирования трансформации.
Есть много случайных факторов в распределении бизнеса. Например, время еды коммерсанта может быть случайность, которая не может быть решена в течение длительного времени. Даже для каждого выполненного заказа в истории, трудно получить истинное значение времени, когда торговец служил еде, потому что данные о человеческих кликах не может быть гарантированы, чтобы быть точными и полными. Торговцы не уверены, когда их пища будет подана. Этот случайный фактор всегда будет существовать и в значительной степени ограничить повышение эффективности доставки. Кроме того, сроки доставки по месту нахождения клиента является неопределенным. Трудно точно оценить время, чтобы получить включения и выключение лифта во время послеобеденного часа пика офисного здания по будням. Конечно, мы постоянно работаем, чтобы сделать наши оценки более точны, но случайность всегда есть. Для гонщиков, платформа не может диктовать порядок, в котором выполняются задачи каждого мотоциклиста. Всадники могут свободно играть в процессе доставки, так что всегда есть неопределенность в том порядке, в котором гонщики выполняют. Для того, чтобы решить эти проблемы, мы стараемся использовать идею надежной оптимизации или стохастического программирования. Однако, если оно основано на случайной выборке сцены, объем вычислений значительно возрастет. Таким образом, нам нужно выполнить оптимизацию на основе обучения. Оптимизация не простая модель машинного обучения, ни простые эвристические правила. Алгоритм оптимизации получаются путем объединения реальных данных и опыта проектировщиков алгоритмов, обучения и развития. Только в этом случае может надежное решение оптимизации можно быстро получить в бизнес-сценариях с очень высокими требованиями к производительности.

В настоящее время направление исследований команды по распространению Meituan включает не только оптимизацию операций, но также машинное обучение, обучение с подкреплением, интеллектуальный анализ данных и другие области. Здесь есть много очень сложных бизнес-сценариев, и вы можете присоединиться к нам.

об авторе

Ван Шэнъяо, присоединившийся к Meituan в 2017 году, является старшим экспертом по алгоритмам в команде доставки Meituan.