Сегодняшняя авторская тема посвящена применению и практике искусственного интеллекта в «Ele.me», которая в основном разделена на три части: первая — введение «Ele.me», вторая — сценарий применения «Ele. меня», и третья лекция по оптимизации операционных исследований и Примеры применения машинного обучения, в этой части будет рассказано о некоторых алгоритмах.
о голодном
Большинство людей заказывали еду на вынос. Теперь еда на вынос стала способом еды в Китае. Что это за заказ? Все в шоке. Самая большая сфера в Китае — это электронная коммерция, Taobao и JD.com, за которой следует индустрия туризма. За Didi и UBER следуют велосипеды общего пользования, которые в сумме делают от 20 до 30 миллионов заказов в день. Как мы все знаем из индустрии доставки еды, эта отрасль достигла 25 миллионов заказов в день, поэтому вполне возможно, что эта отрасль быстро развивается. Почему данные и алгоритмы играют такую большую роль, ведь мы все знаем, что в случае с интернетом + такое большое количество заказов, по крайней мере в индустрии данных, нам есть чем заняться.
Что за сцена "Голодный?" в 25 миллионах заказов: Мы открываем мобильное приложение и можем найти ресторан, который нам нравится. Каждый выбирает ресторан и выбирает, что ему нравится есть. Хотя это поведение заключается в том, чтобы заказать блюдо, оно На самом деле это то же самое, что покупать одежду на Taobao и покупать авиабилеты на Ctrip. Фронт - это еда, торгуемая на торговой платформе электронной коммерции. Теперь это не только еда. На ней можно купить цветы и лекарства, а также есть местные помощники для покупки и доставки. Так что электронная коммерция - это только первая часть. Знаешь ли ты, каковы масштабы электронной коммерции? , "Ele.me" имеет 260 миллионов зарегистрированных пользователей на стороне C, а у продавцов стороны B в настоящее время 1,3 миллиона, а количество заказов составляет десятки миллионов каждый год. Это часть нашей индустрии доставки еды, которая торговая платформа электронной коммерции.
Вторая часть заключается в том, что вы также можете увидеть на этой картинке, что всадник держит коробку, либо идет, либо едет на электрическом велосипеде. По сути, это местная логистическая платформа. Почему мы должны подчеркивать местную? Потому что специфика нашей отрасли отличается от других отраслей логистики. Они прибывают через несколько дней. Местная логистика в нашей отрасли должна рассчитывать на доставку в течение 30 минут. , поэтому мы разработали эту структуру. Есть большие проблемы, когда дело доходит до времени. Это немного отличается. Это станет ясно, когда мы поговорим о модели алгоритма через некоторое время. Мы занимаемся местной логистикой, поэтому есть очень строгие временные ограничения.
На сегодняшний день у нас 3 млн курьеров.В среднем по стране в любое время суток находится от 300 000 до 400 000 райдеров.Они активны офлайн,готовы принять заказы в любое время.Это та же модель работы, что и у Didi, и в настоящее время охвачено более 2000 городов по всей стране.
Об искусственном интеллекте @ Голодный
Вторая часть — это применение ИИ в «Ele.me». Зачем этой отрасли искусственный интеллект? Как платформа для местной жизни, мы все знаем, что еда, одежда, жилье и транспорт очень необходимы. В каждом направлении есть много крупных продавцов.Какие у них технические проблемы?Это должно исходить из их бизнес-формы.
Позвольте мне вкратце объяснить вам: во-первых, это Taobao. Я думаю, что большинство из них будут использовать Taobao. Taobao — это наиболее часто используемая платформа для покупок в Интернете. В основном она основана на пользователях и продавцах. открытая платформа.Каждый делает заказ и всем отправляет.Это три ссылки и одна доставка.Также можно быть новичком самому,или SF Express.Это открытая платформа.Самый важный момент это своевременность,обычно в днях. Чтобы рассчитать, не будет так называемой компенсации с течением времени, как в случае с Taobao.
Давайте посмотрим на Ctrip, он может бронировать отели, отели, онлайн, в основном пользователей и продавцов, и не будет размещать заказы онлайн.
Диди особенно близок к индустрии доставки еды. На самом деле, Uber также очень хорошо работает за границей. С точки зрения формы бизнеса Didi и доставка еды очень близки. Диди офлайн и онлайн всегда пользователи и водители, а форма заказов тоже краудсорсинг.Либо через франчайзи, либо через онлайн регистрацию водителей взять на себя груз, и водитель не будет наказан, если превысит лимит времени, потому что никто может предсказать, что он выйдет из строя, произойдет автомобильная авария, и этот срок не гарантирован, поэтому он очень похож на Ele.me. Наконец, упоминаются «Элеме» и индустрия доставки еды.
Во-первых, онлайн в основном пользователи и продавцы, а офлайн-заказов много.Некоторые из синих райдеров — сотрудники «Ele.me», которая работает самостоятельно, есть команды и франчайзи.Конечно, есть также является общедоступной Например, если сегодня будет встреча, а до полудня еще четыре часа, я могу отправить несколько заказов.Это форма краудсорсинга. Своевременность измеряется минутами.На самом деле наша цель давно достигнута.В среднем заказ может быть доставлен за полчаса по стране,и есть компенсация за сверхурочное время.Если он не прибудет более чем Через 10 минут после 30 минут будет красный конверт Компенсация, компенсация за сверхурочную работу относительно велика, но это своего рода компенсация за недостаточное обслуживание клиентов.
Согласно вышеизложенному, мы вошли в большую структуру, то есть в индустрии доставки еды есть три больших вещи, одна из которых — машинное обучение, а оптимизация исследования операций фактически неотделима от машинного обучения. Когда дело доходит до оптимизации операционных исследований, большие данные играют очень важную роль в качестве основы для оптимизации операционных исследований. Теперь очень интересно посмотреть на эту картину. Я потрачу еще две минуты на обсуждение проблем алгоритмов в бизнесе, которые составляют около трех уровни. Нижняя индустрия доставки еды надеется доставить еду за 30 минут, но ее невозможно доставить на 20 или 30 километров, а если вы не умеете летать, то невозможно доставить 10 километров за полчаса. Исходя из этой ситуации, все отрасли основаны на текущем открытом позиционировании приложения, позиционирование может быть в радиусе 3 или 5 километров, LBS Гарантируется, что на основе оператора выполняются различные рекомендации или поиски, а следующие два слоя — это машинное обучение и оптимизация. Итак, теперь давайте подробно поговорим об этих трех частях.
Первое: Транзакции
Вы можете взглянуть на средний модуль, который представляет собой стратификацию пользователей и продавцов, рекомендуемый поиск и умные субсидии.Эти основные направления — это то, что должна делать любая компания электронной коммерции.
С очень тонкой системой портретов пользователей мы надеемся строго управлять жизненным циклом пользователей и продавцов.На этой основе мы делаем соответствующие рекомендации, поиски и субсидии.Например, если пользователь входит в спящий период, мы пройдем Стимулировать клиентов определенным образом.
Второй: офлайн
Когда транзакция происходит, мы надеемся доставить еду пользователю в течение 30 минут.Это включает в себя планирование машинного обучения.Я подробно расскажу об интеллектуальном планировании, а также подробно расскажу об оценке времени еды и времени доставки. ., а также несколько модулей, таких как динамическое ценообразование. Умное планирование является частью планирования.Наши 30 минут включают в себя время на подготовку и время на дорогу, и даже гарантируют время на отправку вниз, ожидание прибытия лифта к вашей руке и т. д., так что есть много непредсказуемого вещи за 30 минут. Так что же означает баланс давления? Мы все знаем, что онлайн-транзакции и наша логистика противоречивы.Что касается онлайн-транзакций, мы, безусловно, надеемся, что чем больше заказов, тем лучше, мы надеемся, что через несколько секунд придут десятки миллионов пользователей. Однако отправка всех заказов в течение 30 минут — это проблема, которую вряд ли удастся решить сразу.Для достижения баланса давления необходимо обеспечить сбалансированность транзакций с логистикой и дистрибуцией, что не только обеспечивает качество транзакций, но и не теряет энтузиазма пользователей.
Третий: нижний слой
После разговора об этих двух, есть некоторые основные вещи.Теперь давайте посмотрим на предыдущую картинку.Слева есть рекомендации по выбору сайта и т. д. Я только что упомянул, что доставка местная.Когда продавец указал место доставки, он нарисует круг. Например, если я отправлю круг или шестиугольник, это не случайный рисунок. Во-первых, возможно, что это место является шоссе или виадуком. Не у всех платформа одинаковая. Некоторые пользователи Всегда можно размещать дешевые заказы Мы находимся в Все факторы будут учитываться при планировании сети и сайта. Это включает в себя множество задач оперативной оптимизации. Последний пример будет говорить о выборе сайта и планировании сети. Кратко расскажите о наших трех разделах, содержащих все наши попытки в области искусственного интеллекта, которые очень важны для нашего бизнеса.
Об оптимизации операционных исследований и примерах применения
Я разделю эту часть на два типа, а именно случай применения машинного обучения и случай оптимизации социализации машинного обучения.
Случай 1: расчетное время приема пищи
Первый - расчетное время приема пищи. Здесь я использую Didi для сравнения. Каково расчетное время ожидания? Например, мы размещаем заказ на сцене Didi. Например, если я хочу поехать в аэропорт Пудун, он скажет Вы Эта машина находится в двух километрах отсюда, и она прибудет через 3 минуты, а 3 минуты - расчетное время ожидания. "Голоден?" эквивалентен размещению заказа. Выполнение заказа занимает около 20 минут. Я надеюсь, что лучше прийти пораньше, чем приехать. Как мой гонщик на платформе, он прибудет через 20 минут. Если гонщик ждет там рано, это пустая трата Но если вы опоздаете, заказ может превысить время.
Точность времени приема пищи является ключевым моментом. После того, как заказ будет выполнен, как узнать, сколько времени потребуется, чтобы выполнить заказ? На этот ресторан влияет множество факторов, таких как время приготовления еды в ресторане и количество посетителей, которые едят в столовой влияют тип еды, способ приготовления, размер заказа и другие факторы, и нет уведомления после приготовления еды.Например, в ресторане много клиентов.Обычно это можно сделать в течение 5 минут, но это может быть не сделано, если людей слишком много.Есть также проблемы с категориями продуктов, включая даже погоду дня.Разнообразие причин, включая посещаемость ресторана, и внезапную потерю нескольких поваров в ресторан, являются одной из причин неточных оценок. Мы подумали, почему мы не дали это сделать ресторану, и сказали нам, давайте, эта теория осуществима, представьте, что такое кухня в сцене ресторана, представьте себе повара с маслом на руках, выходите и заказывайте Этот заказ готов, и размещается следующий заказ.Это трудно представить.У нас нет данных на этот счет. Это предпосылка. Наше решение, несомненно, машинное обучение. Самый простой вариант — линейная модель. Эффект был не особенно хорош в начале, и постепенно он развился до более позднего использования. GBDT, с ним все знакомы, усреднение не является особым усреднением в сцене, а время приема пищи 10 минут, можем зафиксировать от 7 минут до 13 минут, показатель точности относительно высокий.
Я подчеркиваю среднее, потому что есть много особых сценариев, если что-то случилось с поваром, мы не знаем, потому что машинное обучение может только предсказывать будущее на основе прошлого. Есть какие-то продуктовые планы в экстренных случаях, например, мы видим, что объем еды в ресторане и объем заказов не увеличиваются линейно, а впереди ситуация с заторами, мы настраиваем платформу в режиме реального времени в соответствии с данными.
В конце концов, метод, используемый сейчас, — это глубокое обучение, мы используем LSTM, вы можете прочитать эту статью на картинке справа. Мы делаем прогноз более точным за счет временной корреляции. Нет сомнений, что время приема пищи должно быть связано с прошлыми заказами. Это не нужно объяснять, но почему это связано с будущим. Мы оцениваем, что будут новые заказы. в ближайшие 3-5 минут.Однако он имеет что-то общее с существующими заказами.Это может быть одно и то же блюдо, а может быть и общее место.Одно и то же блюдо-заказ на кухню, а блюда могут быть сделано вместе Мы узнали, что с помощью этой модели мы также можем зафиксировать эти функции, полезные для распределения заказов, а также для упаковки заказов.
Случай 2: Расчетное время в пути
Расчетное время в пути выглядит следующим образом.Когда заказ будет выполнен, водитель возьмет заказ и отправится в офис или домой.Это расчетное время в пути.Диди из пункта А в пункт Б, вид транспорта Должен быть автомобиль, и есть много картографических данных, таких как AutoNavi или Google Maps или Baidu Maps, которые будут загружены на сервер в режиме реального времени.
В этой дорожной ситуации прогноз уже относительно точен, и информации гораздо меньше, чем в сцене «голоден?» Прежде всего, водитель может идти пешком, пользоваться лифтом или подниматься и спускаться. лестнице, или ездить на электромобиле, или менять транспорт, это напрямую приводило к тому, что наш сбор данных был крайне неточным.Другой момент упоминал, что транспорт в здании сложен, и эти данные трудно получить. Когда мы идем на работу, ресторан и клиенты находятся внутри здания, в здании нет сигнала GPS или он не очень хороший, данные, которые мы получаем, или ошибка позиционирования достигает нескольких сотен метров.
Поэтому перед оценкой времени нам необходимо установить траекторию, потому что оценка времени на карте AutoNavi или карте Tencent Baidu основана на исторических данных.Наш первый шаг — очистить исторические данные, а позиционирование в помещении является неточным или даже полностью отсутствует. , В этом случае мы подумали о различных методах. Мы используем сигналы WIFI, сигналы GPS или определяем местонахождение друг друга, чтобы свести к минимуму проблему отсутствия позиционирования. Во-вторых, даже если позиционирование доступно, его местоположение также имеет GPS-треки и Шумов много, поэтому нужно шумоподавить, поэтому нужно шумоподавить. Мы используем алгоритм позиционирования, чтобы объединить релевантное время, точку O и точку D и, наконец, выполнить кластеризацию траектории.
Случай 3: Умное разделение ордеров
DiDi — это не то же самое, что наша сложность разделения заказов.В сценарии Didi необходимо назначить водителя, и можно принять максимум два или три заказа. В «Ele.me» гонщик может одновременно перевозить от 5 до 10 заказов в одной сумке, а между заказами существует ограничение по времени, что влечет за собой множество требований по своевременности.
Я расскажу о двух решениях.Первое решение — это проблема планирования пути, которая очень традиционна для VRP.
Когда вы отдаете заказ, нам нужно найти соответствующую линию при условии фиксированной вместимости и стоимости райдера.Время выполнения каждого заказа разное, то есть это не может быть сверхурочно. В режиме по умолчанию гонщик может отправить от 5 до 10 заказов одновременно, каждый заказ имеет строгие ограничения по времени, и количество заказов резко увеличивается во время дневного пика.
Вариант 1 – планирование пути движения транспорта.
- Входы: заказ, райдер, вместимость, стоимость.
- Выход: сопоставление заказов с райдерами и пешеходными маршрутами;
- Цель оптимизации: минимизировать время или расстояние в пути;
- Ограничения: нечетное количество гонщиков, количество гонщиков, самое позднее время прибытия и т. д.
Мы использовали алгоритм имитации отжига.Имитация отжига (SA) представляет собой стохастический алгоритм оптимизации, основанный на стратегии итеративного решения Монте-Карло.Предоставляя процессу поиска изменяющийся во времени и, в конечном итоге, внезапный скачок с нулевой вероятностью, чтобы он мог эффективно избежать алгоритм оптимизации последовательной структуры, попадающий в локальный минимум и в итоге стремящийся к глобальному оптимуму. Теоретически этот алгоритм имеет вероятностную глобальную производительность оптимизации и широко используется в инженерии, такой как СБИС, планирование производства, инженерия управления, машинное обучение, нейронные сети, обработка сигналов и другие области, которые используются для распределения заказов. результат не особо хороший, т.к. оценка времени не подготовлена, при планировании пути идти первым Single или B single, как только произойдет ошибка времени, планирование пути будет очень плохим.
Наконец, используется второй алгоритм, который также является комбинаторным алгоритмом, основанным на большом количестве функций.
Нижний левый угол — это матрица, каждая строка — это порядок, каждый столбец — это наездник, мы надеемся вычислить его с помощью некоторых правил и некоторых алгоритмов машинного обучения, а правая часть — это результат сопоставления порядка.
Оптимальным совпадением является алгоритм КМ. Самая ранняя эволюция алгоритма планирования — VRP.
Позже появился алгоритм КМ, но после того, как эта базовая структура будет определена, предстоит еще много работы. Заказ на самом деле похож, потому что заказ может быть упакован, и один человек ждет несколько минут.Может быть, этот заказ очень похож на тот заказ, то есть один и тот же человек может отнести заказ в одно и то же место. Поэтому упаковка заказа и водопоглощение - это первое, что мы делаем, но правила заказа разные в пиковые и непиковые периоды.Есть места, где дорога в двух направлениях и угол между двумя направлениями разные. модель сопоставления заказов основана на версии 2.2 и обучается с помощью машинного обучения на основе исторических данных. Здесь мы также сталкиваемся с некоторыми проблемами. Из-за разных привычек персонала доставки на разных сайтах, когда мы переходим к вопросу, в Все думают, что это нормально на сайте А, но не на сайте Б. Мы сейчас делаем тысячи вещей и делимся некоторыми ситуациями на основе истории похожих сайтов.Мы используем эти модели для обучения, чтобы похожие сайты были похожи на то, как о разделении ордеров. Так что не получится сказать, что вам не особо нравится такой способ разделения ордеров, сходство более-менее есть, так что эта версия 2.3 достигнута. Версия, которую мы делаем сейчас, — это обучение с подкреплением, когда мы динамически настраиваемся в соответствии с ситуацией в реальном времени.
Мы не будем вдаваться в подробности о расположении ресторана.На самом деле, мы также начали сотрудничать с торговцами, чтобы открыть несколько ресторанов.Мы все надеемся выбрать лучшее место.Ресторан охватывает наибольшее количество посетителей.Блюда разные, и группы пользователей разные.Поэтому такое расположение очень важно.
The End
Моя тема сегодня — практика применения.Я лично чувствую, что занимаюсь машинным обучением более десяти лет.Вызов моей работы — полнота и точность исходных данных. Мы только что упомянули, что данные неточные и ресторан нестандартный, мы не можем знать точную ситуацию, мы потратили много времени на корректировку основных данных. Второй момент, который я упомянул, заключается в том, что совершенствование алгоритмов и понимание человеческого поведения важнее, потому что в индустрии доставки еды люди должны выполнять это.В прошлом ручное распределение осуществлялось через телефонные звонки, и в нем много общения.Это трудно понять, и машины рассматривают глобальные оптимумы, а не локальные оптимумы, чего люди не могут сделать. Только когда совместите улучшение алгоритма и работу продукта, мы сможем отложить это дело в сторону и позволить всем сформировать привычку. Третий момент заключается в том, что алгоритмы оптимизации и машинное обучение дополняют друг друга в нашей отрасли, не только машинное обучение, но и то, как мы можем наилучшим образом распределить рабочую силу за такой короткий период времени и выполнить заказы за наименьшее количество времени. Спасибо вам всем!
Если у вас есть идея, оставьте комментарий внизу. Спасибо!
об авторе
Чжан Хао, вице-президент Ele.me Technology, отвечающий за искусственный интеллект и построение больших данных. Возглавьте команду, чтобы применить машинное обучение в планировании логистики, балансе давления, рекомендациях по питанию и других сценариях, создать полную систему обработки данных с помощью интеллектуального анализа данных и использовать данные и аналитику для стимулирования развития бизнеса. Обладая более чем десятилетним опытом работы в области машинного обучения, интеллектуального анализа данных и распределения, он работал старшим директором научно-исследовательского института Didi, отдела больших данных Uber, отдела поиска и анализа LinkedIn, группы Microsoft Bing Voice и т. д., занимаясь машинным обучение и работа с большими данными.