Практика применения машинного обучения в начальной точке AutoNavi

машинное обучение

Управляемое чтение: AutoNavi Maps, как ведущий поставщик решений в области путешествий в Китае, навигация является основным пользовательским сценарием. В качестве предпосылки навигации планирование маршрута заключается в настройке планов поездок для пользователей в соответствии с настройками начальной точки, пункта назначения и стратегии пути.

Начиная с дороги, как начального необходимого звена планирования маршрута, ее точность очень важна для качества планирования маршрута и пользовательского опыта. В этой статье будет рассказано об улучшении AutoNavi Map точности отслеживания начальной точки, особенно о некоторых исследованиях и практиках внедрения моделей алгоритмов машинного обучения.

Что является отправной точкой

Прежде всего, давайте кратко представим, что такое отправная точка. Дорога захвата начальной точки относится к запросу планирования маршрута, инициированному пользователем, а положение начальной точки привязано к фактической дороге посредством полученной информации о местоположении пользователя.

Как видно из приложения AutoNavi Maps, пользователи могут выбрать начальную точку при планировании маршрута тремя способами:

1. Ручной выбор точки (пользователь вручную отмечает местоположение на карте).

2. Выбор POI (точка интереса, в географической информационной системе это может быть информация о маркировке географического местоположения, такая как магазины, сообщества, автобусные остановки и т. д.).

3. Автоматическое позиционирование (автоматическое определение местоположения через GPS, базовую станцию ​​или Wi-Fi и т. д.).

Среди трех методов информация о местоположении двух методов ручного выбора точки пользователем и выбора точки POI является относительно точной, а степень точности захвата дороги начальной точки относительно высока.

В методе автоматического определения начальной точки из-за влияния GPS, базовой станции и точности позиционирования в сети координаты позиционирования склонны к дрейфу, и положение, полученное устройством позиционирования, может отличаться от фактической дороги, на которой пользователь располагается на несколько метров, десятков метров, а то и сотен метров. Как точно определить местонахождение пользователя на реальной дороге в условиях ограниченной информации — вот основная проблема, которую нам нужно решить.

Зачем внедрять машинное обучение

До внедрения машинного обучения для сортировки дорог-кандидатов путем захвата начальной точки использовались ручные правила. Основная идея заключается в следующем: с расстоянием в качестве основного признака, в сочетании с углом, скоростью и другими характеристиками, взвешенными расчетными баллами, а затем влияющими на рейтинг, веса и пороговые значения, используемые в ручных правилах, определяются вручную на основе всестороннего реального боевого опыта.

С постоянным ростом бизнеса карт AutoNavi и увеличением количества запросов и сценариев планирования ограничения ручных правил становятся все более и более очевидными, что отражается в следующих аспектах:

• Даже если включено много опытов, искусственно установленные пороги и веса все еще не совершенны, и это неизменный факт, что он склонен к дрейфу или имеет слепые зоны.

• С точки зрения обслуживания политики, в условиях обновления исходных данных новые функции не могут быть добавлены в политику как можно быстрее.

• Ручное установление правил требует большого опыта, и трудно максимально оперативно реагировать на кадровые изменения.

В эпоху больших данных и искусственного интеллекта неизбежной тенденцией является использование мощности данных для замены части человеческого труда, автоматизации процессов и повышения эффективности работы.

Поэтому, исходя из текущей ситуации и проблем с ручными правилами захвата дороги в начальной точке, мы вводим модель машинного обучения для автоматического изучения взаимосвязи между функциями и результатами захвата дороги. С одной стороны, при большом объеме данных планирования и реализации AutoNavi имеет естественное преимущество в получении обучающих данных для моделей машинного обучения, с другой стороны, модели машинного обучения обладают большей выразительностью и могут изучать сложные взаимосвязи между функциями. точность захвата.

Как внедрить машинное обучение

Возвращаясь к самому машинному обучению, давайте представим, как мы создаем начальную модель машинного обучения. В целом использование методов машинного обучения для решения практических задач можно разделить на следующие аспекты:

• Определение целевой проблемы

• Сбор данных и разработка функций

• Выбор модели

• Обучение модели и оценка эффекта

1. Определение целевой проблемы Прежде чем внедрять модель машинного обучения, решаемая задача должна быть математически абстрагирована.

Анализируя задачу захвата дороги из начальной точки, как показано на рисунке выше, мы видим, что когда пользователь инициирует запрос планирования маршрута в точке А, окружающая дорога, соответствующая местоположению А, является независимым множеством В, а фактическая дорога, на которой находится пользователь, это единственный элемент C в наборе.

Таким образом, проблема захвата дороги в начальной точке трансформируется в выбор дороги, которая с наибольшей вероятностью будет фактическим местоположением пользователя, из набора дорог вокруг точки позиционирования.

Весь процесс аналогичен поисковой сортировке, поэтому мы также применяем метод поисковой сортировки при формулировании схемы моделирования.

i. Извлеките информацию о местоположении A из пользовательского запроса на планирование маршрута.

2. Вспомните дороги в пределах определенного диапазона вокруг точки позиционирования, чтобы сформировать альтернативный набор B.

iii) Отсортируйте дороги-кандидаты, и, наконец, первая дорога-кандидат является выходным результатом модели, то есть дорогой C, на которой фактически находится пользователь.

В конечном счете, мы определяем захват источника как проблему ранжирования в контролируемом поиске. Имея то, что должно быть достигнуто, мы начинаем думать о сборе данных и разработке функций.

2. Сбор данных и разработка функций В отрасли часто говорят, что данные и функции определяют верхний предел машинного обучения, а модели и алгоритмы лишь приближают этот верхний предел. Видно, что для конечного эффекта проекта данные и характеристики имеют решающее значение.

Чтобы обучить начальную модель машинного обучения, нам нужно получить два типа данных из исходных данных:

• Наземные данные, то есть фактическая информация о дороге, когда пользователь отправляет запрос на планирование маршрута.

Когда машинное обучение применяется к начальной точке проекта захвата дорог, первой проблемой является получение достоверных данных. Пользователь инициирует запрос на планирование маршрута в определенном месте А. Из-за ограничения точности позиционирования мы не можем подтвердить его фактическое местоположение.Однако, если у пользователя есть фактическая информация о поездке рядом с инициирующим запросом на планирование, фактическая информация о поездке может быть сопоставлена. к дорожной сети, чтобы сгенерировать траекторию движения, по этой траектории мы можем получить фактическую дорогу, на которой находится запрошенная точка привязки.

Мы проводим соответствующий анализ данных навигационного запроса AutoNavi Map, объединяем фактическую прогулку пользователя с информацией о планировании маршрута и получаем набор данных, который последовательно сопоставляет запрос и истинное значение.

• Характеристические данные В начальной модели захвата дороги мы извлекли три типа признаков для создания выборочного набора, а именно признаки, связанные с точкой позиционирования, характеристики самой дороги и комбинированные признаки между точкой позиционирования и дорогой.

Обработка признаков является основной частью разработки признаков. В разных проектах используется разная предварительная обработка признаков. Требуется специализированная обработка в соответствии с реальными бизнес-сценариями, часто полагающаяся на профессиональный полевой опыт. В начальной точке проекта захвата дорог мы выполнили работу по очистке данных, такую ​​как дедупликация образцов, обработка выбросов, исправление значений ошибок и сопоставление для функций позиционирования.

3. Выбор модели В определении целевой проблемы мы анализируем отправную точку как проблему ранжирования поиска, а технология ранжирования машинного обучения в основном включает три категории: точечный, парный и списочный.

В соответствии с характеристиками отправной точки бизнеса по захвату дорог, мы используем список, и его структура обучения ранжированию имеет следующие характеристики:

• Входная информация представляет собой многофункциональный вектор (т. е. запрос), состоящий из всех дорог, соответствующих одному и тому же запросу планирования маршрута.

• Выходная информация представляет собой оценочную последовательность векторов признаков, соответствующих запросам (т. е. одному и тому же запросу).

• Для функции оценки мы используем древовидную модель.

Мы выбираем NDCG (Normalized Discounted Cumulative Gain) в качестве индекса оценки модели.NDCG — это индекс, который всесторонне рассматривает связь между результатами ранжирования модели и реальной последовательностью, а также широко используемый индекс для измерения результатов ранжирования.

4. Обучение модели и оценка эффекта Мы извлекли информацию о запросе в течение определенного периода времени, получили соответствующие наземные данные и данные о признаках в соответствии с методом, описанным в шаге 2, разметили и построили выборку, разделили ее на обучающую и тестовую выборки, обучили модель и проверили соответствовали ли результаты ожиданиям.

Чтобы оценить эффект модели, мы используем ручные правила и модели машинного обучения для захвата запросов тестового набора соответственно и сравниваем их с истинными значениями для расчета точности.

Сравнивая результаты, для случайно выбранных запросов разница в результатах захвата дороги между моделью и ручными правилами составляет 10%. ручных правил, и эффект замечательный.

напиши в конце

Выше мы представили некоторые приложения больших данных и машинного обучения в начале пути, Успешный запуск проекта также подтверждает, что машинное обучение может играть важную роль в повышении точности и оптимизации процессов.

В будущем мы надеемся продолжать совершенствовать существующие сценарии моделей, находить новые точки получения дохода, совместно исследовать с точки зрения данных и моделей и продолжать оптимизировать эффект машинного обучения.

Следите за AutoNavi, чтобы найти больше профессионального контента в области технологий для путешествий