Технология искусственного интеллекта, стоящая за доставщиками еды Meituan

задний план

С наступлением цифровой эпохи рынок доставки еды в последние годы быстро развивался. Для систем логистики на вынос решающее значение имеют эффективность доставки и пользовательский опыт. Фактический процесс доставки, наконец, завершается курьерами.Поэтому, чтобы действительно повысить эффективность доставки, необходимо не только усердно работать над интеллектуальной системой планирования (распределение заказов, планирование маршрута, ETA), но также постоянно улучшать «дополнительные» возможности сотрудников службы доставки, позволяя им отправлять больше «приготовленных», более «гладких» и «быстрых». Взяв это за отправную точку, группа исследований и разработок Meituan-Dianping разработала интеллектуального помощника гонщика, чтобы всесторонне улучшить способности гонщика во всех аспектах.

На Глобальной конференции по технологиям искусственного интеллекта и машинного обучения AICon в январе Хэ Жэньцин, глава направления искусственного интеллекта Meituan Dianping, поделился «Технологией и практикой интеллектуального помощника Meituan Rider». Объясните, как использовать интеллектуальные наушники и голосовое взаимодействие в качестве носителей, а также использовать интеллектуальный анализ больших данных, машинное обучение, обработку естественного языка и другие технологии, чтобы интеллектуальные помощники могли точно распознавать сложные сцены и предоставлять интеллектуальные услуги в случае сложных сред использования и различных пользователей. группы Push, интеллектуальное руководство, полное голосовое управление и другие возможности. В конечном счете, с точки зрения интеллекта, безопасности, удобства, точности и других аспектов возможности распределения райдера будут всесторонне улучшены, что повысит общую эффективность распределения и удобство для пользователей. Ниже приводится содержание выступлений:

Коммерческая ценность технологии искусственного интеллекта для внутригородской доставки

В целом логистический бизнес является относительно традиционной отраслью, но с ростом всей электронной коммерции, мобильного Интернета и мобильных платежей вся логистическая отрасль в последние годы достигла устойчивого и быстрого развития.

На изображении выше представлен отчет, опубликованный Китайской федерацией логистики и закупок в 2016 году. Данные опроса показывают, что количество логистических единиц по всей стране увеличилось более чем на 50% по сравнению с предыдущим месяцем, достигнув более 30 миллиардов единиц.

В то же время доля всех затрат на логистику также очень высока: как видно из рисунка, затраты на логистику составляют 15% от ВВП. В европейских и американских странах, а также в Японии эта доля составляет всего около 8% к 9%, поэтому в логистической отрасли Китая еще есть много возможностей для оптимизации. Это также очень важная причина, по которой многие компании инвестируют значительные средства в логистическую отрасль: отрасль находится в стадии быстрого развития, и существует огромное пространство для оптимизации с точки зрения опыта, эффективности и затрат, и многое еще предстоит сделать. .

На следующем рисунке в основном представлена текущая разработка Meituan Takeaway:

Запущенная в 2013 году, Meituan Waimai в настоящее время обслуживает около 250 миллионов пользователей, охватывая более 1300 городов, обслуживая более 2 миллионов продавцов и получая более 18 миллионов ежедневных пиковых заказов. Интеллектуальная система планирования доставки Meituan на вынос каждый день сопоставляет более 500 000 братьев на вынос.Основываясь на массивных данных и алгоритмах искусственного интеллекта, она гарантирует, что среднее время доставки не превышает 28 минут. Это также самая крупная и самая сложная в мире многоточечная интеллектуальная система планирования распределения в реальном времени.

Наше позиционирование для доставки Meituan:Сделайте крупнейшую платформу мгновенной доставки.

По сравнению с традиционной логистикой мгновенная доставка включает в себя следующие преимущества:

Номер один, очень быстро. От продавца, размещающего заказ, например заказ на вынос, выполнение заказа занимает в среднем 30 минут с момента размещения заказа до пользователя, а самое медленное время должно составлять около часа. Быстрота является наиболее важной характеристикой. Быстрота также может значительно улучшить требования и качество обслуживания всего сервиса.
Второй момент — возможность напрямую связываться с пользователями и продавцами. В прошлом логистика в основном получала заказы от продавцов и должна была проходить через множество звеньев, включая складирование, планирование транспортировки, распределение персонала и т. д., и, наконец, доставляться пользователям.После нескольких изменений в середине они даже распределялись разные компании, или были разные франчайзи. Однако мгновенная доставка напрямую связывает пользователей и продавцов, а затем напрямую влияет на целевую группу, что является большой ценностью.
Третий момент заключается в том, что он может выполнять различные сценарии доставки, не только для еды на вынос, но и для супермаркетов, свежих продуктов и т. Д. В принципе, вся внутригородская экспресс-почта может быть включена в сферу его службы доставки.

В общем, дистрибуция — очень сложный бизнес, и чтобы всем было понятно, я абстрагировался и упростил эту бизнес-модель, которую можно проиллюстрировать следующей картинкой.

По сути, распространение — это в основном процесс согласования потребностей пользователей в распределении с различными автономными возможностями (такими как гонщики или транспортные средства). Сопоставление делится на офлайн-сопоставление и онлайн-сопоставление.Офлайн-сопоставление в основном зависит от работы, а онлайн-это некоторые системы, созданные нашим техническим отделом. С этой точки зрения нам нужно решить, как добиться оптимального соответствия между этим спросом и мощностью.

На самом деле это относительно традиционная проблема, такая как реклама или рекомендация, столкнется с этой проблемой, спрос - это продукт, который следует рекомендовать, предложение - это рекламная позиция, но позиция не бесконечна, как достичь лучшего между спросом и Supply Matching, что само по себе является проблемой оптимизации эффективности, но оценки CTR, используемые в рекламе и рекомендациях, и методы, используемые в логистике, более сложны.

Сложности в дистрибуции, в частности, заключаются в нескольких моментах:

Это NP-сложная задача, и вычислительная сложность возрастает экспоненциально с увеличением масштаба. Например, проблема планирования пути N заказов на гонщика или задача распределения заказов M заказов и K гонщиков, обе из которых экспоненциально сложны и взаимосвязаны.
Это не только проблема многоточечного получения и многоточечной доставки, но и новые заказы добавляются в любое время, что требует очень серьезных вычислений в реальном времени.Когда новый заказ генерируется, операция планирования должна быть завершена в течение десятков миллисекунд По сравнению с традиционной логистикой С более чем десятками минут вычислительного времени проектирование системы мгновенной доставки намного сложнее.
Сцена доставки очень сложна и включает в себя десятки факторов, таких как погода, дорожные условия, навыки райдера и скорость продавцов, подающих еду, что значительно увеличивает случайность и сложность понимания пространства и создает большие проблемы для стабильности. адаптивность алгоритма доставки.

Чтобы выполнить эту задачу, доставка Meituan должна быть разделена примерно на три уровня, как показано в правой части рисунка выше.

Первый слой – это строительство логистической инфраструктуры. В том числе, как строить площадку в городе, как распределять рабочую силу и как распределять снабжение предприятий. Эти инфраструктуры не только сильно влияют на масштабы, стоимость и эффективность дистрибуции, но и являются основой для управления логистикой и операциями. очень важную роль, и их трудно вносить коррективы в режиме реального времени, и это проверка возможностей технологии долгосрочного прогнозирования и планирования.
Второй слой, динамический баланс спроса и предложения, регулирует рынок посредством механизма ценообразования, включающего несколько аспектов: один — базовое ценообразование, например, когда поступает заказ, сколько взимается с пользователей, сколько взимается с продавцов. , и сколько субсидий предоставляется гонщикам , что требует учета многих факторов для обеспечения разумных и справедливых цен. Другой - баланс спроса и предложения.При возникновении чрезвычайных ситуаций, таких как плохая погода, динамическая корректировка цен используется для корректировки пользовательского спроса и предложения мощности в режиме реального времени, чтобы обеспечить стабильность всей системы и удобство работы пользователей.
Третий уровень — это сопоставление заказов и райдеров в реальном времени, то есть диспетчеризация ордеров.После того, как ордер появляется, он назначается наиболее подходящему райдеру в течение десятков миллисекунд, и планирование пути для нескольких ордеров завершается. Это задача NP-Hard, и из-за постоянной генерации новых заказов требуются вычисления в реальном времени, а требования к механизмам параллельных вычислений высоки. Целью оптимизации диспетчеризации заказов является повышение общей эффективности дистрибуции и обеспечение удобства пользователей.Это один из основных модулей всей системы дистрибуции.

Вышеизложенное в основном является нашим пониманием всего дистрибутива, а затем как использовать технические средства для реализации и практики.

Для задачи ИИ, как должна выглядеть классификация всего распределения в задаче ИИ? Рисунок ниже дает объяснение.

Мы можем смотреть на проблемы ИИ с двух сторон. Одно измерение заключается в том, чтобы посмотреть на сравнение между машиной и ручным управлением, быстрее ли скорость, чем вручную, и лучше ли это, чем ручное.

Еще одним аспектом является роль, которую играет ИИ. Прежде всего, возможно ли воспринимать мир?Например, распознавание изображений, распознавание речи и OCR сейчас используются для восприятия мира как человека. Во-вторых, можно ли ее распознать. Например, если вы произносите предложение «Как сегодня погода?», не только голос должен быть переведен в текст, но и сущность «погода» и ограничивающие факторы "сегодня". В-третьих, принимать решения.Сейчас более популярные приложения искусственного интеллекта находятся на уровне «как принимать решения», и принимать решения лучше, чем люди. Некоторые репрезентативные приложения, такие как интеллектуальные помощники, особенно те, которые помогают людям в принятии решений (чат-боты будут хуже), могут помочь вам выполнять более качественные задачи, такие как автономное вождение, например, в области логистики, как распределять заказы и передавать беспилотные автомобили или другие способы доставки заказов; а в играх и медицинском обслуживании ИИ помогает врачам в принятии решений, а в играх, когда пользователи отключены, игровой ИИ может помочь пользователям бороться с монстрами и апгрейдиться.

Видно, что на уровне доставки мы будем использовать несколько аспектов, таких как умные помощники, умная логистика и беспилотное вождение. Чтобы улучшить общий интеллект доставки, мы встроили наш собственный «ИИ доставки Meituan» в два. части:

Первая часть – это информатизация, то есть сбор данных. Например, какие данные должны быть собраны? Нам нужно собрать данные о деловом районе. Возможно, этот деловой район нужно будет уточнить на уровне сообщества и здания, где находится здание, разрешает ли это сообщество въезжать водителям, а также собирать данные о погоде, такие как скорость ветра, температура, есть ли какая-либо дымка, потому что все данные повлияют на эффективность доставки, ситуация с заказом пользователя, такая как сегодняшний смог, заказы на вынос в Пекине, как ожидается, вырастут.

Вторая часть — интеллект, то есть создание набора интеллектуальных модулей для формирования интеллектуальной системы распределения, охватывающей все аспекты распределения.

Чтобы выполнить эту сложную задачу «ИИ доставки Meituan» и учесть долгосрочное развитие всей отрасли, наша общая схема ИИ выглядит следующим образом:

Во-первых, построение широты. Наша цель состоит в том, чтобы оптимизировать общий процесс доставки и ссылки, охватывая каждый этап доставки с момента размещения заказа пользователем.По этой причине наше общее техническое направление очень широкое, не только по трем основным дисциплинам, но и по прогнозированию, добыче полезных ископаемых , ценообразование, планирование, составление графиков и аппаратное обеспечение — все это требует технических исследований и внедрения в бизнес.
Во-вторых, глубина конструкции. Это относится не только к техническим аспектам, таким как базовая вычислительная среда и модельные исследования, но и к глубокой интеграции технологий и бизнеса по распределению, например, создание платформы моделирования распределения, которая способна моделировать несколько сценариев распределения и может анализировать различные бизнес-стратегии, не выходя в интернет, эффект точно оценивается. В то же время необходимо предоставить интеллектуальные решения для отрасли, основанные на ситуации в отрасли, такие как разработка более эффективных стимулов для гонщиков и механизмов удержания гонщиков с точки зрения работы гонщиков.

Голосовой помощник Meituan на вынос — хороший пример нашего сочетания широты и глубины. Далее я поделюсь с вами некоторым нашим опытом в практике и проектировании всего интеллектуального помощника, а также всего логистического бизнеса, как лучше внедрить технологию искусственного интеллекта.

Позиционирование интеллектуального голосового помощника Meituan на вынос

Зачем нужны умные голосовые помощники? В каких случаях водителю нужна услуга «интеллектуальный помощник» и что является ключом ко всей услуге? Позвольте мне сначала объяснить это. Как показано на рисунке выше, это некоторые из звеньев, с которыми сталкивается весь райдер в процессе доставки, который можно разделить на две части.

Первая часть — это онлайн-принятие решений, и она включает в себя множество решений. Например, у этого пассажира есть заказ, который нужно доставить пользователю, и он может принять несколько решений, например, звонить ли пользователю, потому что в некоторых местах нет необходимости звонить по телефону. здание, всадник имеет много Существует высокая вероятность того, что пользователь должен быть дома, и нет необходимости звонить; некоторые должны быть вызваны, например, офисное здание, потому что всадник не может подняться, поэтому необходимо позвонить заранее, чтобы подвести пользователя.

Но насколько заранее? На одну, две или пять минут вперед? Эта проблема очень критична. Если время звонка раньше, пользователь спустится раньше, что вызовет проблему пользователя, ожидающего всадника. Пользовательский опыт не очень хороший, и могут быть жалобы. Если пассажир очень консервативен и звонит вниз, но пользователь живет на 10-м этаже, пользователю может потребоваться 10 минут, чтобы спуститься, включая ожидание лифта, и эффективность станет очень низкой.

Вторая часть — это процесс работы гонщика, потому что гонщик будет часто взаимодействовать с мобильным телефоном. Он хочет проверить заказ, шаги очень сложные, он достает телефон, разблокирует его, открывает приложение, проверяет информацию, выполняет операции (например, нажимает «Готово») и, наконец, кладет его обратно на телефон, что занимает около пяти-шести процессов. Это также занимает от 10 до 20 секунд, если операция выполняется быстро. И многие всадники делают эти операции во время езды, что может быть очень опасно.

Подводя итог, трудности, с которыми сталкиваются курьеры, можно разделить на три основных уровня:

Во-первых, задача сложная и требует множества решений, хотя сложность зависит от мастерства гонщика.
Во-вторых, операция громоздкая, занимает около пяти-шести шагов, минимум 10-20 секунд и более.
В-третьих, водителю очень опасно пользоваться мобильным телефоном во время езды. Для платформы с 500 000 гонщиков мы должны думать о безопасности гонщиков на протяжении всей поездки.

Исходя из этих соображений, мы сделали голосового помощника Meituan на вынос, и его позиционирование в основном включает следующие три пункта:

Во-первых, требуется безопасность. Требуется полнофункциональное решение для голосового взаимодействия. Все звенья в процессе доставки могут управляться голосом, без необходимости для водителя смотреть на мобильный телефон, освобождая руки и делая всадник безопаснее. Например, в процессе вождения приходит заказ, и система спрашивает водителя, хочет ли он принять заказ, пока он отвечает через команду «Да» или «Нет» или «ОК», процесс завершен, нет необходимости делать как раньше, таким образом, вынимать телефон, а затем использовать его, очень популярно среди райдеров.
Второй шаг — разработка минималистских шагов.Все операции можно выполнить за один или два шага.Первый шаг — передача информации, а второй шаг — завершение операции с помощью голосовых команд.Первоначальные пять-шесть шагов упрощены. Один или два пока.
В-третьих, предоставлять множество интеллектуальных услуг. Самый типичный пример: велосипедист, которого вы только что упомянули, идет к зданию. Пользователь может находиться на 5-м или 4-м этажах. Сколько времени требуется пользователю, чтобы спуститься? Дайте разумные рекомендации. информация об адресе, система разумно рекомендует время для звонка.Конечно, основные функции, такие как навигация, также включены.

Приведенный выше анализ в основном анализирует наиболее важные моменты того, как мы помещаем интеллектуального голосового помощника в сцену. Мы хотим приземлиться, суть в том, чтобы помочь гонщикам выполнить задание по доставке, а не «болтать» или «вопрос-ответ». Это требует, чтобы весь процесс голосового взаимодействия был очень удобным и интеллектуальным.

Первая проблема, с которой мы столкнулись, заключалась в том, как спроектировать режим взаимодействия.

Как показано на рисунке выше, левая сторона — это общее решение голосового помощника, которое требует четырех шагов пробуждения, ответа, запроса и повторного ответа, но не соответствует требованиям сценария доставки. Во-первых, в сцене, где находится гонщик, много шума, такого как шум ветра, шум автомобилей, шум торгового центра и т. Д., И трудно проснуться. Во-вторых, требуется четыре шага, а также учитывается рабочее состояние райдера, что слишком громоздко.

Что делать тогда? Мы думаем, можем ли мы добиться решения, не требующего пробуждения? Ответ: да, это можно сделать!

Во-первых, у нас много данных. Включая пассажиров, пользователей и продавцов, эти данные поступают в режиме реального времени, и мы можем получить гораздо больше глобальной информации о доставке, чем райдеры. Во-вторых, мы можем делать точные прогнозы и использовать машинное обучение, интеллектуальное планирование и другие технологии для определения следующего рабочего места водителя.

Например, у райдера может быть несколько заказов, и он двигается к месту, благодаря анализу сцены мы знаем, какому пользователю он хочет доставить, и мы можем понять, на скольких этажах находится пользователь в здании, и, вероятно, несколько минут, чтобы можно было рассчитать, в какой момент времени лучше напомнить водителю о звонке. Таким образом, мы можем опустить процесс пробуждения и ответа и отправить напоминание непосредственно водителю, которому нужно только ответить «да» или «нет». Только таким образом дизайн может соответствовать фактической ситуации распространения райдера в автономном режиме и действительно может решить актуальную проблему для райдера, так что его действительно можно назвать «умным».

Основная технология искусственного интеллекта

Конкретная технология делится на несколько основных частей. Первая часть — это инфраструктура, в том числе распознавание речи и семантическое понимание.Сейчас в этой области много всего с открытым исходным кодом, и сделать общее распознавание речи несложно.

В нашей сцене для решения проблемы различных шумов окружающей среды всадник может не говорить, но рядом с ним какой-то шум, шум машины или другие шумы, или даже песня играет на дороге, это будет распознается как говорящий водитель, поэтому предстоит проделать большую работу на стороне VAD (обнаружение тишины).

Еще одним фундаментальным компонентом является NLU, понимание естественного языка. Например, если гонщик хочет позвонить по бортовому номеру 6551, во-первых, системе нужно знать, что гонщик намерен позвонить, а затем нужно мобилизовать операцию вызова; во-вторых, ей нужно знать, кто звонящий, это пользователь, а не пользователь.Для мерчантов необходимо узнать информацию о пользователе, в-третьих, необходимо обнаружить, например, если гонщик уже доставил заказ, повторный звонок может быть неправильное действие, и водителю нужно напомнить.

Сценарий мгновенной доставки — типичная проблема временных рядов. Как видно из приведенного выше рисунка, сцена содержит контекстные отношения. Историческое поведение и решения гонщика будут влиять на настоящее, а текущие решения и поведение будут влиять на будущее. Это типичная проблема временных рядов.

При распознавании сцен необходимо решить две основные задачи: одна — прогнозирование событий: необходимо знать, что произойдет в следующий момент, например, прибыл ли всадник к продавцу и подал ли уже продавцу еду; другой прогноз времени, который будет вызываться в будущем Когда лучше всего звонить по телефону?

Чтобы лучше проиллюстрировать, возьмем случай телефонного звонка.

Прежде всего, необходимо решить, нужно ли делать телефонный звонок.Если часто напоминать о телефонном звонке в ненужной сцене, это будет беспокоить как водителя, так и пользователя. На рисунке выше показано соотношение вызовов водителей по разным типам адресов, видно, что это соотношение высокое на предприятиях и в офисных зданиях, но очень низкое в жилых районах, так как в жилых районах высока вероятность того, что пользователи дома.

Во-вторых, необходимо указать подходящее время звонка для каждого сообщества и типа здания, то есть, за какое время до звонка, что является лучшим опытом для райдеров и пользователей. Если вызов слишком ранний, пользователь ждет водителя внизу, и опыт относительно плохой. Звонить слишком поздно, когда водители ждут пользователей внизу, слишком неэффективно. У нас есть точные данные о велосипедной траектории, и мы знаем, как долго водитель будет оставаться внизу, если звонит в разное время для каждого здания и каждого сообщества, поэтому мы можем нарисовать кривую. Соответствующий интервал находится между двумя красными линиями.

Первые два — это в основном анализ больших данных, и, наконец, требуется принятие решений в режиме реального времени, в каком порядке и когда звонить. Здесь необходимо предсказать следующее место доставки гонщика и задачу доставки в режиме реального времени в соответствии с данными гонщика в реальном времени, включая статус заказа, статус траектории, условия окружающей среды и т. д., в сочетании с предыдущим анализом больших данных, и дать следующее место доставки пассажира и задание на доставку в нужное время с помощью голосового помощника.

С точки зрения реализации, для распознавания сцен требуются три технологии: анализ траектории движения, машинное обучение и анализ данных.

Давайте сначала представим траекторию, у нас могут быть миллиарды данных о местоположении каждый день, а затем мы можем делать много вещей на основе этих данных.

Во-первых, вы можете точно знать лучший способ навигации между точками A и B. По сравнению со сторонними картами вы можете выяснить, что может быть лучший способ езды между точками A и B.

Во-вторых, одних данных о траектории недостаточно, необходимо решить проблему внутреннего позиционирования, внутреннего GPS-позиционирования уже недостаточно, нужна новая техническая система. Например, позиционирование Wi-Fi, но также необходимо разработать аппаратное обеспечение, например, развертывание аппаратного обеспечения у продавцов, оценивая, прибывает ли покупатель в магазин.

В-третьих, использование датчиков, будь то в помещении или в помещении, нам нужно не только знать точное позиционирование всадника, но также знать способ движения, например, оставаться, ходить, ездить верхом, подниматься по лестнице или пользоваться лифтом, эта информация не только судить Что, черт возьми, всадник делает. И он может точно описать сложность распространения, что очень ценно при ценообразовании и планировании.

Мы можем исправить навигацию и позиционирование по треку. Давайте рассмотрим два примера.

Первый пример (слева) — это распределение позиционирования пользователя при размещении заказа, так как каждый размещает заказ в помещении, отклонение позиционирования очень велико. Однако за счет коррекции траектории гонщика фактически имеется только четыре точки, каждую из которых можно рассматривать как дверной проем этого здания, что значительно повышает точность позиционирования пользователя и облегчает доставку райдеру.

Второй пример (правая сторона) корректирует путь движения двух точек AB через траекторию всадника.Анализ траектории на рисунке выше находит более короткий путь, что экономит время при пересечении сообщества;на рисунке ниже исходная навигация по карте необходимо пересечь эстакаду посередине улицы, но через трассу обнаруживается, что больше гонщиков совершают объезд, что больше соответствует реальной ситуации.

Ниже представлены некоторые технологии, связанные с машинным обучением, в основном применяемые на различных уровнях оценки времени.

Для более точного прогнозирования поведения пассажиров можно использовать только высокоточные оценки ETA (расчетное время прибытия).Мы сделаем точные оценки в трех измерениях, включая время доставки самолета, время подъема и спуска по лестнице и время, которое подавать блюда. Таким образом, процесс доставки райдера может быть описан более подробно и точно.

С этой целью мы проделали большую базовую работу, такую как платформа функций в реальном времени, платформа машинного обучения и различные работы, связанные с машинным обучением, включая модели глубокого обучения. В то же время мы также сделаем более детальное построение карты знаний о распределении, например, уточненное разрешение адресов.

Адреса являются очень важной информацией для распространения.С помощью НЛП и поиска по карте их можно преобразовать в иерархическую структуру, что очень полезно для анализа деловых районов и построения портретов измерений. Мы разбиваем адрес на четыре уровня: сообщество, номер дома, номер квартиры и этаж и т. д. Среди них есть много практических проблем, которые необходимо решить, например, информация, заполняемая пользователями, совершенно нестандартна, и есть неясности.

После выполнения этой работы фактический эффект все еще очень интересен. Анализируем через конкретный сценарий «время подниматься и спускаться по лестнице».

Первое изображение — это время подъема и спуска по лестнице разных зданий, два слева — это время двух зданий в Сямыне, а два справа — среднее значение Сямыня и среднее значение по стране. Видно, что разница во времени подъема и спуска по лестнице разных зданий все же большая, и ее нельзя просто заменить средним значением городского или национального измерения.

Вторая картинка - время подъема и спуска по разным этажам, начиная с B2 и заканчивая 8-м этажом. Очень интересно, что длина подъема и спуска по лестнице не линейна с высотой.Вероятно, на втором, третьем и четвертом этажах временной интервал очень большой, но когда он достигает пятого, шестого и седьмого этажей , разница во времени очень маленькая. . Причина проста, когда этажи ниже, всадник может подняться по лестнице. Верхние этажи предпочитают подниматься на лифте. Время пребывания между разными этажами очень короткое, и временной интервал становится меньше по мере подъема.

Третья картинка — распределение времени подъема и спуска по лестнице в разных городах, самое интересное — желтая линия, то есть общее время подъема и спуска по лестнице в Чунцине явно больше. Поскольку Чунцин — горный город, дома часто стоят на склонах холмов, и, конечно, подниматься и спускаться по лестнице труднее, чем на равнине.

общий эффект

Технология распознавания сцен, на которую опирается голосовой помощник, была представлена в целом, и теперь представлен общий эффект голосового помощника. Прежде всего, голосовой помощник предоставляет четыре основные функции, включая настраиваемые наушники, голосовое взаимодействие, распознавание сцен и интеллектуальное руководство.

Зачем настраивать наушники? В среде использования гонщика необходимо преодолеть много шума, что трудно сделать с помощью программного обеспечения и программ, но необходимо сделать с помощью оборудования. Поэтому мы сотрудничаем с производителями, чтобы настроить оборудование с хорошим эффектом шумоподавления.

Вторая функция - голосовое взаимодействие. Она может реализовать голосовое взаимодействие во всем процессе доставки, например, при отправке заказа, запросе, получении еды и телефонном звонке. Водителю не нужно смотреть на мобильный телефон в течение всего процесса, но может завершить интеллектуальную доставку, пока гарнитура напоминает.

В-третьих, это функция интеллектуального руководства, включая напоминания о безопасном вождении, информационные передачи, руководство по карте миссии и т. Д., В основном для того, чтобы сделать вождение водителя более безопасным, предоставить исчерпывающие информационные услуги и сделать доставку пассажиров более удобной и эффективной.

На рисунке ниже приведены некоторые фактические данные по офлайн-продвижению интеллектуального голоса.

Синяя линия — это количество действий гонщика с помощью голосового помощника, а зеленая линия — количество действий, которые не используются. Видно, что количество операций значительно сократилось. Но до 0 он не упал по двум причинам: гонщику не нужно пользоваться голосовым помощником в стационарном состоянии, Bluetooth-гарнитуры некоторых райдеров не доставлены на место. Посмотрите на следующую картинку:

На картинке слева показано распределение времени приема заказов райдерами, чем правее, чем дольше райдеры принимают заказы, тем хуже пользовательский опыт. Зеленая линия - это распределение ручных приказов, полученных гонщиками в прошлом.Длинный хвост более серьезный.При приеме голосовых приказов время заказа явно ближе к левому, а общее время заказа значительно сокращается, что лучше улучшает пользовательский опыт.

График справа представляет собой соотношение времени, которое пассажиры тратят на доставку еды пользователям, а горизонтальная ось — это время, которое пассажиры проводят внизу в ожидании пользователей.Чем дальше вправо, тем дольше пассажиры тратят время на ожидание пользователей внизу. После голосового напоминания это может значительно сократить время ожидания гонщика и сэкономить много времени гонщика.

напиши в конце

Подводя итог, распознавание речи и голосовые помощники сталкиваются со многими проблемами в реальном процессе реализации, и большинство из них связаны со сценой.Распознавание сцены очень важно, даже важнее, чем распознавание речи.

Поскольку распознавание речи в настоящее время является относительно распространенной технологией, и есть много профессиональных производителей, предоставляющих услуги, как и аппаратное обеспечение, его относительно легко настроить. Таким образом, в настоящее время не проблема быть голосовым помощником, который сочетает в себе программное и аппаратное обеспечение, и это не проблема с точки зрения базовой технологии, нет особых технических препятствий для того, чтобы быть DEMO.

Напротив, в конкретном бизнесе нам действительно нужно подумать, как совместить бизнес-сценарий и реализовать голосового помощника. То есть, как сделать голосового помощника из «удобного» в «простого в использовании», а затем заставить пользователей «захотеть использовать» — это реальные проблемы, с которыми голосовые помощники столкнутся в будущем.

Распознавание голоса и голосовые помощники имеют много проблем в реальном процессе внедрения, и они связаны со сценой.Распознавание сцены важнее, даже важнее, чем распознавание голоса, потому что распознавание голоса в настоящее время является относительно распространенной технологией.Как совмещать бизнес-сценарии. , внедрение и использование голосовых помощников может быть проблемой в течение определенного периода времени в будущем.

Чтобы реализовать всесторонний интеллект распределения, Meituan Dianping проделал большую работу и попытался не только хорошо справиться с машинным обучением, но и как провести лучшую операционную оптимизацию в реальном времени, интеллектуальный анализ пространственных данных в реальном времени. , взаимодействие человека с компьютером и т. д. Техническое содержание во многих аспектах.

об авторе

Ренцин, директор по стратегии алгоритмов доставки Meituan-Dianping. В 2016 году он присоединился к Meituan Dianping и отвечал за общее направление алгоритма доставки Meituan. Включая интеллектуальную систему планирования, интеллектуальную систему сетевого планирования, платформу машинного обучения, платформу моделирования распределения и т. д., он полностью поддерживает разработку специальной доставки Meituan, экспресс-доставки, поручений и других направлений бизнеса. До прихода в Meituan Dianping он был архитектором T9 в команде Baidu Fengchao, занимаясь исследованиями в области НЛП для поисковой рекламы, интеллектуального анализа данных и технологий поиска.

Если вы заинтересованы в нашей команде, вы можете следить за нашимистолбец. Команда доставки еды Meituan Dianping приветствует выдающиеся таланты в области больших данных, алгоритмов и машин. Пожалуйста, присылайте свое резюме по адресу: sunbiqi#meituan.com

исходный адрес:Specialties.Meituan.com/ и Renqing_Ah…