Meituan Brain: метод моделирования графа знаний и его применение

искусственный интеллект глубокое обучение Microsoft NLP
Meituan Brain: метод моделирования графа знаний и его применение

Являясь одним из наиболее важных методов представления знаний в эпоху искусственного интеллекта, графы знаний могут нарушить изоляцию данных в различных сценариях и обеспечить базовую поддержку таких приложений, как поиск, рекомендации, ответы на вопросы, интерпретация и принятие решений. Meituan Brain создала сверхкрупномасштабную карту знаний в области жизни и развлечений, основанную на различных сценариях, таких как еда, питье и игра, и установила всестороннюю связь между пользователями и бизнесом. Мы, Meituan, надеемся, что благодаря более глубокому пониманию пользовательских предпочтений и позиционирования бизнеса в сценариях приложений мы сможем предоставлять более качественные интеллектуальные услуги для населения, помогать всем лучше питаться и лучше жить.

Недавно доктор Ван Чжунъюань, глава Центра НЛП отдела платформы ИИ компании Meituan и руководитель Центра поисковой разведки Дяньпин, был приглашен провести онлайн-сессию обмена в базовом лагере технологий ИИ, объясняя идеи дизайна, процесс строительства и текущие аспекты Meituan Brain.Столкнувшиеся проблемы, а также конкретное применение и практика в Meituan Dianping организованы следующим образом:

Важность графов знаний

В последние годы искусственный интеллект стремительно меняет жизнь людей.Можно увидеть, что различные технологические компании запустили продукты или системы искусственного интеллекта.Например, в 2016 году Google запустила AlphaGo, которая охватила весь мир Go, как только вышла и выиграл игру Human Champion. Другим примером является беспилотный супермаркет Amazon Go, запущенный Amazon.Пользователям нужно только загрузить приложение, зайти в супермаркет, они могут взять товар напрямую и выйти, не выстраиваясь в очередь, чтобы проверить.Это «новая розничная торговля». Опыт эпохи искусственного интеллекта. Другой пример — Skype Translator, запущенный Microsoft, который может помочь людям, использующим разные языки, общаться в режиме реального времени и без барьеров. Другой пример — интеллектуальный помощник Siri от Apple, который позволяет каждому пользователю iPhone очень удобно выполнять различные задачи. Появление всех этих продуктов искусственного интеллекта зависит от быстрого развития технологий в различных областях, включая машинное обучение, компьютерное зрение, распознавание речи, обработку естественного языка и многое другое.

Являясь ведущей в мире платформой электронной коммерции для жизненных услуг, Meituan Dianping также активно внедряет искусственный интеллект. В феврале этого года был официально создан Центр НЛП Департамента платформы ИИ, наше видение — использовать искусственный интеллект, чтобы помочь всем лучше питаться и лучше жить. Язык — это кристаллизация человеческого интеллекта, а обработка естественного языка — одна из самых сложных проблем в искусственном интеллекте.Основная задача — заставить машины понимать и использовать язык так же, как люди.

Мы надеемся, что в ближайшем будущем, когда пользователь опубликует отзыв, машина сможет прочитать отзыв и полностью понять эмоции пользователя. Когда пользователь входит на бизнес-страницу Dianping, сталкиваясь с тысячами пользовательских комментариев, мы надеемся, что машина сможет быстро прочитать эти комментарии от имени пользователя и обобщить деловую ситуацию для справки пользователя. В будущем, когда у пользователей возникнут какие-либо потребности в принятии решений в отношении общественного питания и развлечений, Meituan Dianping может предоставить услуги помощника искусственного интеллекта, чтобы помочь пользователям быстро принимать решения.

Все это зависит от двух технологических драйверов искусственного интеллекта:глубокое обучениеиГрафик знаний. Мы можем сделать простое сравнение двух методов:

Мы резюмируем глубокое обучение как скрытую модель, которая обычно ориентирована на конкретную задачу, такую ​​как игра в го, распознавание кошек, распознавание лиц, распознавание речи и так далее. Вообще говоря, он может достигать очень хороших результатов на многих задачах, а также имеет много ограничений, например, требует массивных обучающих данных и очень мощной вычислительной мощности, трудно переносить задачи, и это может быть плохое объяснение.

С другой стороны, граф знаний — еще один крупный технологический драйвер искусственного интеллекта, который можно широко применять для решения различных задач. По сравнению с глубоким обучением знания в графе знаний могут быть ускорены, а интерпретируемость очень сильна, подобно человеческому мышлению.

Мы можем использовать приведенный выше пример, чтобы увидеть, как методы глубокого обучения и люди распознают кошек и чем отличаются их процессы.

В 2012 году Google X Labs объявила об использовании методов глубокого обучения, позволяющих машинам успешно распознавать кошек на фотографиях. Они используют 1000 серверов, 16 000 процессоров, соединенных между собой, чтобы сформировать ИИ-мозг с миллиардами узлов. Система прочитала 10 миллионов изображений, взятых с YouTube, и, наконец, успешно определила, есть ли на них кошки.

Давайте посмотрим, как это делают люди. Для 3-летнего ребенка нам достаточно показать ему несколько картинок с кошками, и он сможет быстро идентифицировать кошек на разных картинках, что собственно и является аргументацией мозга для этих знаний.

В 2011 году в журнале Science была очень известная статья под названием «Как вырастить разум». Авторами данной статьи являются профессора престижных американских университетов, таких как MIT, CMU, UC Berkeley и Stanford. В этой статье самый важный вывод:Если мы можем мыслить дальше данных данных, то должен быть еще один источник информации, чтобы компенсировать разницу..

Какой здесь язык познания? Для человека это фактически школьное образование, которое мы получили с детства, информация, которую мы видели в газетах и ​​по телевизору, и знания, которые мы накопили через социальные сети и общение с другими людьми.

В последние годы как научные круги, так и промышленность создали свои собственные карты знаний, в том числе карты знаний для всех областей и карты знаний для вертикальных областей. Фактически, еще в эпоху Возрождения Бэкон предположил, что «знание — сила», а в сегодняшнюю эпоху искусственного интеллекта крупные технологические компании предложили:Граф знаний — основа искусственного интеллекта.

Интернет-компании по всему миру активно внедряют карты знаний. Еще в 2010 году Microsoft начала строить графы знаний, включая Satori и Probase. В 2012 году Google официально выпустил Google Knowledge Graph, и сейчас масштаб достиг примерно 70 миллиардов. В настоящее время у Microsoft и Google самый большой в мире график общих знаний, у Facebook самый большой в мире график социальных знаний, а у Alibaba и Amazon соответственно построены графики знаний о товарах.

Если мы различаем в соответствии с процессом человеческого понимания и ответов на вопросы, мы можем разделить графы знаний на две категории. Давайте рассмотрим пример. Если пользователь видит такой вопрос: «Кто был президентом США, когда Ангелы выиграли Мировую серию?» Я думаю, что все пользователи могут понять этот вопрос, когда команда Ангелов выиграла Мировую серию. , кто является президентом Соединенных Штатов?

Это процесс понимания проблемы, и знание, которое для этого требуется, обычно называют знанием здравого смысла. С другой стороны, многие пользователи сети, возможно, не смогут ответить на этот вопрос, потому что это требует других энциклопедических знаний.

Поэтому разделим граф знаний на две категории, одна называется Common Sense Knowledge Graph (граф знаний здравого смысла), а другая называется Encyclopedia Knowledge Graph (граф энциклопедических знаний). Между этими двумя типами графов знаний есть очевидные различия. Для графа знаний здравого смысла мы обычно извлекаем лингвистические знания между этими словами; для графа знаний энциклопедии мы обычно заботимся о его сущностях и фактах между этими сущностями.

Вообще говоря, для графа знаний здравого смысла отношение, о котором мы заботимся, включает отношение isA, isPropertyOf Relation. Для Encyclopedia Knowledge Graph мы обычно заранее определяем некоторые предикаты, такие как DayOfbirth, LocationIn, SpouseOf и так далее.

График знаний здравого смысла обычно имеет определенную вероятность, но график знаний энциклопедии обычно «черно-белый», поэтому при построении такого типа графика знаний нас волнует точность.

Репрезентативные работы Common Sense Knowledge Graph включают WordNet, KnowItAll, NELL и Microsoft Concept Graph. Encyclopedia Knowledge Graph включает Freepase, Yago, Google Knowledge Graph и строящийся «Meituan Brain».

Вот две репрезентативные работы: 1) График знаний здравого смысла: Probase; 2) График знаний энциклопедии: Мейтуанский мозг.

График знаний здравого смысла

Microsoft Concept Graph был официально выпущен в ноябре 2016 года, но он был исследован еще в 2010 году и представляет собой очень большой график. На этом графике миллионы Узлов.У этих Узлов есть Концепции, такие как Испанские Художники;Сущности, такие как Пикассо;Атрибуты, Такие как День Рождения (день рождения);есть Глаголы(глаголы), есть Прилагательные(прилагательные),такие как Ешь, сладкий. Есть также много, много ребер.Самое важное ребро — это ребро isA, такое как Picasso, и ребро isPropertyOf. Что касается других Отношений, мы будем коллективно называть их Сосуществованием.

Это наша дорожная карта исследований для графика знаний здравого смысла во время нашего пребывания в Microsoft Research Asia. После того, как мы построили График Здравого Смысла, важно было построить на нем различные модели. Мы предлагаем несколько моделей под названием «Концептуализация», которые могут поддерживать сходство терминов, сходство коротких текстов и обнаружение модификаторов заголовков и, в конечном счете, поддерживать различные приложения, такие как NER, текстовые аннотации, рекламные объявления, рекомендации по запросам, понимание текста и другие.

Что такое понимание короткого текста? Как здравый смысл используется в понимании текста? Ниже мы можем рассмотреть некоторые конкретные примеры:

Когда все видят текст посередине выше, я полагаю, что каждый может понять, что это должна быть дата, но никто не может знать, что эта дата означает. Но если мы дадим еще какую-то контекстную информацию, такую ​​как Пикассо, испанский язык и т. д., у всех будет какое-то здравое суждение об этой дате. Мы можем предположить, что эта дата, вероятно, будет датой рождения Пикассо или датой его смерти, что является здравым смыслом.

Например, когда мы даем двум объектам Китай и Индию, наш мозг будет рассуждать на основе здравого смысла, и мы будем думать, что эти два объекта описывают страну. Если вы укажете еще одну организацию: Бразилию, мы обычно думаем о развивающихся рынках в это время. Если вы добавите Россию, вы можете подумать о «БРИК» или «БРИК». Все это рассуждения здравого смысла.

Другой пример: когда мы видим Инженера и Apple, мы делаем некоторые выводы об Apple, думая, что это ИТ-компания, но если мы дадим дополнительную контекстную информацию, в этом предложении, из-за появления еды, я считаю, что каждый Мозг будет рассуждать так же, исходя из здравого смысла, думая, что это яблоко больше не означает «компания», а означает «фрукты».

Итак, это наша модель концептуализации, которая является явным представлением. Мы надеемся, что он может сопоставлять текст, особенно краткий текст, с миллионами понятий.Такое представление может быть проще для понимания пользователями и может применяться к различным сценариям.

В этом PPT мы представляем результаты концептуализации. Когда на входе будет груша и яблоко, мы сопоставим это яблоко с фруктами. Но если это iPad Apple, мы сопоставим его с Компанией и заметим, что это не единственный результат, мы на самом деле сопоставим с Концептуальным вектором. Насколько велик этот концептуальный вектор? Это Вектор с миллионами измерений, и это также очень Разреженный Вектор.

Какие проблемы с пониманием текста мы можем решить с помощью такой модели концептуализации? Мы можем рассмотреть такой пример. Например, учитывая очень короткий текст Python, это всего лишь один экземпляр, тогда мы захотим сопоставить его по крайней мере с двумя категориями концепций, одна из которых может быть языком программирования, а другая — змеей. Когда у него есть какой-то контекст, такой как учебник по Python, тогда Python должен ссылаться на язык программирования в это время.Если у него есть другое прилагательное, глагол, например, Dangerous, тогда мы будем понимать Python как Snake.

В то же время, если в тексте есть несколько объектов, таких как DNN Tool и Python, мы надеемся, что сможем определить, какой из них является более важным в тексте, а какой используется для ограничения.

Ниже мы кратко расскажем, как это сделать. Когда мы ищем один экземпляр в Google, эта панель знаний обычно появляется справа. Для экземпляра, такого как Microsoft, мы видим концепцию, обрамленную красной рамкой. Microsoft указывает на технологическую компанию. Как это реализовано?

Мы видим, что Microsoft на самом деле указывает на множество понятий, таких как компания, компания-разработчик программного обеспечения, технологический лидер и так далее. Какому Концепту мы сопоставляем его лучше всего?

Если его сопоставить с концепцией компании, это, очевидно, правильно, но мы не можем отличить Microsoft от других типов продуктов, таких как KFC и BMW. С другой стороны, если мы сопоставляем Microsoft с крупнейшим поставщиком настольных ОС, то это очень специфическая концепция, что не очень хорошо, почему? Поскольку эта концепция слишком конкретна и детализирована, она может содержать только такую ​​сущность, как Microsoft, тогда она теряет абстрактную способность концепции.

Итак, мы хотим сопоставить Microsoft с концепцией, которая не является ни особенно общей (абстрактной), ни особенно конкретной (конкретной). В лингвистике мы называем это отображение базовым уровнем, а весь процесс отображения мы называем концептуализацией базового уровня.

Мы предлагаем метод вычисления концептуализации базового уровня, который на самом деле очень прост и очень эффективен. Это должно сделать некоторое слияние двух типичностей, и мы также доказываем некоторые корреляции между ними и PMI и временем в пути. А на крупномасштабном наборе данных мы оцениваем их по Precision и NDCG. Наконец, доказано, что предлагаемый нами метод подсчета очков позволяет добиться лучших результатов как в отношении NDCG, так и в отношении точности. Самое главное, теоретически он может очень хорошо объяснить базовый уровень.

Давайте посмотрим, как нам поступить, когда экземпляр имеет некоторый контекст. Кратко объясним основную идею на примере.

Например, iPad, Apple, где iPad в принципе без разницы, он будет сопоставляться с Device, Product. Но для Apple это может соответствовать по крайней мере двум типам понятий, таким как Fruit и Company. Итак, как мы можем использовать iPad, чтобы устранить неоднозначность Apple?

На самом деле метод достаточно интуитивен. Мы найдем такие объекты, как iPad, с помощью множества статистических данных, которые обычно появляются вместе с данными о компании и продукте. Например, iPad может появиться вместе с Samsung, а может появиться вместе с Google, тогда мы обнаружим, что он часто будет появляться вместе с Брендом, Компанией и Продуктом. Таким образом, мы использовали недавно раскопанные Знания, чтобы устранить неоднозначность Apple, что является основной идеей, стоящей за этим.

В дополнение к общему контексту во многих случаях эти тексты могут также содержать много специальных типов, таких как глагол и прилагательное. В частности, мы надеемся, что когда мы видим «Смотрите Гарри Поттера», мы можем знать, что «Гарри Поттер» — это фильм, а когда мы видим «Читай Гарри Поттера», мы можем знать, что «Гарри Поттер» — это книга. Точно так же «Гарри Поттер» может быть именем персонажа или названием игры.

Итак, давайте посмотрим, как решить такую ​​​​вещь. Когда мы видим «Смотрите Гарри Поттера», нам в первую очередь нужно знать, что «Гарри Поттер» может быть книгой или фильмом. Мы можем рассчитать априорную вероятность, обычно с помощью крупномасштабной статистики. В то же время нам нужно знать, что Watch может быть существительным, а может быть и глаголом, и нам также нужно копать, когда Watch используется как глагол, он очень тесно связан с Movie.

Следовательно, нам, по сути, необходимо провести некоторые вероятностные рассуждения, не только для очень тонкой декомпозиции условной вероятности, но и в конце концов для вычисления вероятности.

С помощью метода расчета вероятности мы действительно можем построить очень большой офлайн-граф знаний, тогда у нас может быть много терминов на этом, а также некоторые типы, к которым они принадлежат, и некоторые ассоциации между разными терминами.

Когда мы используем такой очень большой автономный граф знаний для понимания текста, мы можем сначала сегментировать текст, а после сегментации мы можем фактически извлечь его из этого очень большого автономного графа знаний — подграф. Наконец, мы использовали модель случайного обхода с перезапуском для классификации такого онлайн-подграфа.

Давайте еще раз посмотрим, что делать, если в тексте содержится несколько сущностей? Нам нужно провести добычу знаний, как это сделать? Во-первых, мы можем получить много журналов запросов, а затем мы также можем зарезервировать некоторые шаблоны.Благодаря определению этого шаблона мы можем извлечь множество отношений, таких как заголовок и модификатор между объектами, затем мы можем использовать эти объекты в следующий шаг Сопоставьте с Концепцией, а затем получите Шаблон.

В этом процессе мы хотим сопоставить Сущность с Концепцией, тогда это Концептуализация, упомянутая ранее. Мы надеемся, что отображение в будущем не будет слишком общим, чтобы избежать конфликтов концептуальных паттернов.

Но оно не может быть слишком конкретным, потому что, если оно слишком конкретное, ему может не хватать способности к выражению. В худшем случае он может выродиться до уровня Сущности, а Сущность как минимум миллионного масштаба, тогда все Концептуальные Паттерны могут стать миллионнократно миллионным уровнем, что заведомо недоступно.

Итак, мы использовали метод концептуализации базового уровня, представленный ранее, и сопоставили его с понятием, которое не является ни общим, ни конкретным.

Вы можете взглянуть на некоторые из лучших концептуальных паттернов, которые нам удалось раскопать, такие как Game и Platform, которые являются концепцией и паттерном. Для чего это? Чтобы привести конкретный пример, когда пользователь ищет Angry Birds, iOS, мы можем знать, что пользователь ищет игру Angry Birds, а iOS — это платформа, используемая для ограничения этой игры. Apple будет выпускать новую версию iOS каждый год, поэтому после того, как мы выкопаем такие концептуальные шаблоны, независимо от того, выйдет ли Apple на iOS 15 или iOS 16, нам нужно только сопоставить их с платформой, тогда наши концептуальные шаблоны все равно будут действительно, так что расширение знаний может быть сделано легко.

Таким образом, интеллектуальный анализ знаний здравого смысла и моделирование концептуализации можно использовать во многих приложениях, например, для расчета схожести коротких текстов, классификации, кластеризации и семантического соответствия, системы вопросов и ответов, чат-ботов для рекламы и т. д.

Meituan Brain - Граф энциклопедии знаний

После знакомства с графом знаний здравого смысла позвольте мне представить вам граф знаний энциклопедии. Это проект графа знаний Meituan — Meituan Brain.

Что такое мозг Мейтуана? Meituan Brain — это крупнейшая в мире карта знаний о ресторанах и развлечениях, которую мы создаем. Мы надеемся полностью изучить общедоступные данные в различных бизнес-сценариях, связанных с Meituan Dianping.Например, мы накопили 4 миллиарда отзывов пользователей, более 100 000 персонализированных ярлыков, более 30 миллионов продавцов и более 140 миллионов магазинов по всему миру. блюда, мы также определяем 20 уровней детального анализа настроений.

Мы надеемся полностью изучить связи между этими элементами, построить «мозг» знаний и использовать его для предоставления более интеллектуальных жизненных услуг.

Давайте кратко представим, как устроен мозг Meituan. Мы будем использовать различные модели, такие как языковая модель (статистическая языковая модель), тематическая модель (модель генерации тем) и модель глубокого обучения (модель глубокого обучения), надеясь, что сможем анализировать бизнес-этикетки, этикетки блюд и анализ настроений и т. д.

Чтобы добывать теги продавца, сначала мы должны позволить машине прочитать отзывы. Мы использовали неконтролируемые и контролируемые модели глубокого обучения.

Для неконтролируемой модели мы в основном используем LDA, который характеризуется низкой стоимостью и отсутствием необходимости в размеченных данных. Конечно, его точность будет относительно неконтролируемой, и в то же время нам нужно будет вручную проверять выкапываемые метки. Что касается модели глубокого обучения с учителем, то мы используем LSTM, для которого характерна потребность в относительно большом количестве размеченных данных.

Через метки, добытые этими двумя моделями, мы добавим некоторые рассуждения в граф знаний, чтобы окончательно построить метку продавца.

Если есть много отзывов об этом продавце по таким темам, как детские стульчики, питание для младенцев и детские пакеты, то мы можем получить много ярлыков об этом продавце. Например, мы можем знать, что это ресторан для родителей и детей, его обстановка более уникальна, а обслуживание более восторженное.

Давайте представим, как мы майним этикетки блюд? Мы использовали Bi-LSTM, а также модель CRF. Например, из этого комментария мы можем извлечь такую ​​Сущность, а затем, создав некоторые ассоциации с другими сайтами рецептов, мы можем получить ее ингредиенты, способы приготовления, вкусы и другую информацию, чтобы мы могли предоставить информацию для каждого ресторана. очень богатый вкус этикетки, этикетки ингредиентов и другие этикетки.

Давайте кратко представим, как мы проводим анализ настроений в данных комментариев. Мы используем модель CNN+LSTM, и для оценки каждого пользователя мы можем проанализировать некоторые из его эмоциональных тенденций. В то же время мы также проводим детальный анализ настроений.Мы надеемся проанализировать результаты различного анализа настроений в различных измерениях, таких как транспорт, окружающая среда, гигиена, блюда, вкус и т. д., с помощью краткой оценки пользователей. . Стоит отметить, что в настоящее время в мире нет хорошего решения для такого рода результатов мелкозернистого анализа настроений, но мозг Meituan сделал очень важный шаг.

Ниже описано, как реализована наша карта знаний. В настоящее время графы знаний в отрасли имеют множество зрелых приложений, таких как роботы для поиска, рекомендаций, ответов на вопросы и интеллектуальных помощников, включая очень хорошие приложения в носимых устройствах, борьбе с мошенничеством и принятии клинических решений. В то же время в отрасли также проводится множество исследований, включая интеллектуальные бизнес-модели, интеллектуальные исследования рынка, интеллектуальные системы членства и т. д.

Как мы можем использовать графы знаний, чтобы улучшить наш поиск? Если вы откроете Dianping сейчас и будете искать определенное блюдо, например, острые раки, на самом деле наша машина уже заранее прочитала для вас все отзывы, а затем проанализирует продавцов, которые предоставляют это блюдо, мы также будем основываться на отзывах пользователей. . Результаты анализа тональности для улучшения рейтинга в поиске.

Кроме того, мы также используем его для персональных рекомендаций в деловых районах. Когда вы открываете Dianping, если вы в настоящее время находитесь в торговом центре или деловом районе, вы скоро сможете увидеть страницу входа в торговый центр или деловой район. Когда пользователи входят в этот торговый центр и на страницу продавца, через график знаний мы можем предоставить персонализированную сортировку и персонализированную рекомендацию «тысячи людей и тысячи лиц».

На самом деле за этим используется модель глубокого обучения «водная волна».Для более подробного ознакомления с этой моделью глубокого обучения вы можете обратиться к нашей статье о CIKM.

Все это, на самом деле, еще много технологических прорывов ждет нас, чтобы решить. Например, граф знаний всего мозга Meituan составляет порядка десятков миллиардов, что также является крупнейшим в мире графом знаний о общественном питании и развлечениях.Для поддержки этого графа знаний нам необходимо изучить граф уровня 100 миллиардов. технологии хранения данных и вычислительных машин. Мы также создаем очень крупномасштабный кластер графического процессора для поддержки алгоритмов глубокого обучения для больших объемов данных. В будущем, когда все эти технологии станут зрелыми, мы также надеемся предоставить всем пользователям возможности «умного ресторана» и «умного помощника».

Статья воспроизведена с сайта AI Technology Base Camp (rgznai100) с некоторыми исправлениями.

об авторе

Чжун Юань, доктор философии, старший научный сотрудник и старший директор Meituan Dianping, руководитель Центра НЛП отдела Meituan AI Platform и руководитель Dianping Search Intelligence Center. До прихода в Meituan-Dianping он был научным сотрудником Facebook в США и отвечал за NLP-сервис Facebook на уровне продукта. До Facebook он был исследователем в Microsoft Research Asia, ответственным за проект Microsoft Research Knowledge Graph и проект Dialogue Robot. На протяжении многих лет он занимался обработкой естественного языка, графом знаний и его исследованиями в области понимания текста.Он опубликовал более 30 статей на ведущих международных научных конференциях, таких как VLDB, ICDE, IJCAI, CIKM и т. д., и выиграл Премия ICDE 2015 Best Paper Award и является спикером ACL учебного пособия 2016 года «Понимание коротких текстов», опубликовал 3 академические монографии и получил 5 патентов США. Он имеет богатый опыт в области исследований NLP и KG и реальных систем продуктов, включая: обработку естественного языка, граф знаний, глубокое обучение, интеллектуальный анализ данных и т. д.

Предложения о работе

Команда Meituan Dianping NLP набирает все виды талантов алгоритмов, доступны базы Пекин и Шанхай. Миссия Центра НЛП состоит в том, чтобы создать базовую технологию обработки естественного языка и сервисные возможности мирового класса, опираясь на НЛП (обработка естественного языка), глубокое обучение (глубокое обучение), граф знаний (граф знаний) и другие технологии для обработки информации. массивные текстовые данные Meituan Dianping, получить данные различных сценариев, таких как общественное питание, путешествия, отдых и развлечения и т. д., построить карту знаний Meituan Dianping, создать общую службу НЛП и предоставить интеллектуальные услуги семантического понимания текста для Meituan Различные предприятия Дяньпина. Наша команда занимается не только внедрением технологии ИИ, но и проводит среднесрочные и долгосрочные фундаментальные исследования НЛП и графов знаний. Текущие проекты и предприятия включают Meituan Dianping Knowledge Graph, интеллектуальное обслуживание клиентов, голосовой семантический поиск, семантическое понимание комментариев к статьям, интеллектуальный помощник Meituan Dianping и т. д. Это действительно способствует реализации корпоративной миссии «помочь всем лучше питаться и жить лучше», оптимизировать жизненный опыт пользователей, а также улучшать и повышать качество жизни потребителей. Добро пожаловать, друзья, чтобы рекомендовать или самостоятельно рекомендоватьhr.ai@meituan.com.

Алгоритм Пост:Инженер алгоритмов НЛП/эксперт/исследователь,Граф знаний Инженер-алгоритм/Эксперт/Исследователь

Инженерный пост:C++/Java R&D эксперт/инженер,Инженер/эксперт по исследованиям и разработкам платформы ИИ

Сообщение о продукте:Менеджер по продуктам ИИ/Эксперт(НЛП, направление данных)

在这里插入图片描述