Изучение и применение технологии анализа настроений в Meituan

В мае 2021 года Центр НЛП Meituan как можно скорее открыл крупнейший китайский набор данных анализа настроений на уровне атрибутов, основанный на реальных сценах. Соответствующие документы этого набора данных были приняты NAACL2021, ведущей конференцией по обработке естественного языка, и китайским открытым исходным кодом. данные были добавлены в набор данных Plan Qianyan будет работать с другими наборами данных с открытым исходным кодом, чтобы способствовать развитию китайских технологий обработки информации. В этом документе рассматривается эволюция технологии анализа настроений Meituan и ее применение в типичных бизнес-сценариях, включая анализ настроений на уровне глав/предложений, анализ настроений на уровне атрибутов и анализ триплетов мнений. В бизнес-приложениях онлайн-сервисы прогнозирования в реальном времени и автономные сервисы пакетного прогнозирования строятся на основе технических возможностей анализа настроений. До сих пор служба анализа настроений предоставляла услуги для более чем десяти бизнес-сценариев в Meituan.

использованная литература

[1] GitHub.com/Mehtuan-DI Ах….
[2] Bu J, Ren L, Zheng S, et al. ASAP: A Chinese Review Dataset Towards Aspect Category Sentiment Analysis and Rating Prediction. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. 2021.
[3] www.luge.ai/
[4] Zhang, L. , S. Wang , and B. Liu . "Deep Learning for Sentiment Analysis : A Survey." Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery (2018):e1253.
[5] Liu, Bing. "Sentiment analysis and opinion mining." Synthesis lectures on human language technologies 5.1 (2012): 1-167.
[6] Peng, Haiyun, et al. "Knowing what, how and why: A near complete solution for aspect-based sentiment analysis." In Proceedings of the AAAI Conference on Artificial Intelligence. Vol. 34. No. 05. 2020.
[7] Zhang, Chen, et al. "A Multi-task Learning Framework for Opinion Triplet Extraction." In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: Findings. 2020.
[8] Yoon Kim. 2014. Convolutional neural networks for sentence classification. arXiv preprint arXiv:1408.5882.
[9] Peng Zhou, Wei Shi, Jun Tian, Zhenyu Qi, Bingchen Li, Hongwei Hao и Bo Xu, 2016. Двунаправленные сети долговременной кратковременной памяти на основе внимания для классификации отношений, Proceedings of the 54th Annual Meeting. Ассоциации компьютерной лингвистики (Том 2: Краткие статьи), страницы 207–212.
[10] Девлин, Джейкоб и др. «Берт: предварительное обучение глубоких двунаправленных преобразователей для понимания языка», препринт arXiv arXiv: 1810.04805 (2018).
[11] Ян Ян, Цзя Хао и др. Исследование и практика Meituan BERT.
[12] Pontiki, Maria, et al. "Semeval-2016 task 5: Aspect based sentiment analysis." International workshop on semantic evaluation. 2016.
[13] Pontiki, M. , et al. "SemEval-2014 Task 4: Aspect Based Sentiment Analysis." In Proceedings of International Workshop on Semantic Evaluation at (2014).
[14] Ецюань Ван, Минли Хуанг и Ли Чжао, 2016 г. LSTM на основе внимания для классификации настроений на уровне аспектов, Материалы конференции 2016 г. по эмпирическим методам обработки естественного языка, страницы 606–615.
[15] Сара Сабур, Николас Фросс и Джеффри Э. Хинтон, 2017. Динамическая маршрутизация между капсулами, Достижения в системах обработки нейронной информации, страницы 3856–3866.
[16] Chi Sun, Luyao Huang, and Xipeng Qiu. 2019. Utilizing bert for aspect-based sentiment analysis via constructing auxiliary sentence. arXiv preprint arXiv:1903.09588.
[17] Qingnan Jiang, Lei Chen, Ruifeng Xu, Xiang Ao и Min Yang, 2019 г. Набор сложных данных и эффективные модели для анализа настроений на основе аспектов, Материалы конференции 2019 г. по эмпирическим методам обработки естественного языка и 9-го Международная совместная конференция по обработке естественного языка (EMNLP-IJCNLP), страницы 6281–6286.
[18] Wu, Zhen, et al. "Grid Tagging Scheme for End-to-End Fine-grained Opinion Extraction." In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: Findings. 2020.
[19] Liu, Yinhan, et al. "Roberta: A robustly optimized bert pretraining approach." arXiv preprint arXiv:1907.11692 (2019).
[20] Clark, Kevin, et al. "Electra: Pre-training text encoders as discriminators rather than generators." arXiv preprint arXiv:2003.10555 (2020).

0- [21] Timothy Dozat and Christopher D. Manning. 2017.Deep biaffine attention for neural dependency parsing. In 5th International Conference on Learning Representations, ICLR 2017.

об авторе

Жэнь Лэй, Цзяхао, Чжан Чен, Ян Ян, Мэнсюэ, Ма Фан, Кинг Конг, Увэй и т. д. — все они происходят из Центра НЛП отдела поиска и НЛП платформы Meituan.

Предложения о работе

Отдел поиска и НЛП Meituan/Центр НЛП является основной группой, отвечающей за исследования и разработку технологии искусственного интеллекта Meituan.Его миссия состоит в том, чтобы создать базовую технологию обработки естественного языка мирового уровня и сервисные возможности.

Центр НЛП уже давно набирает специалистов по алгоритмам обработки естественного языка/алгоритмов машинного обучения Заинтересованные студенты могут отправить свои резюме наrenlei04@meituan.com. Конкретные требования заключаются в следующем.

Рабочие обязанности

Перспективное исследование предварительно обученных языковых моделей, включая, помимо прочего, предварительное обучение, основанное на знаниях, предварительное обучение на основе задач, предварительное обучение мультимодальных моделей и предварительное обучение на нескольких языках;
Отвечает за обучение и оптимизацию производительности супермоделей с более чем 10 миллиардами параметров;
Точная настройка модели и перспективное исследование технологий, включая, помимо прочего, оперативную настройку, настройку адаптера и различные направления обучения передаче с эффективными параметрами;
Перспективное изучение технологии сжатия вывода/обучения модели, включая, помимо прочего, квантование, обрезку, тензорный анализ, KD и NAS и т. д.;
Завершите применение предварительно обученных моделей в поисковых, рекомендательных, рекламных и других бизнес-сценариях и достигните бизнес-целей;
Участвуйте в создании и продвижении внутренней платформы НЛП Meituan.

профессиональные требования

Более 2 лет соответствующего опыта работы, участие в разработке алгоритмов как минимум в одной из областей поиска, рекомендаций и рекламы, а также внимание к прогрессу отрасли и научных кругов;
Надежная основа алгоритма, знакомство с обработкой естественного языка, графом знаний и технологией машинного обучения, энтузиазм в отношении разработки и применения технологий;
Знакомы с языками программирования, такими как Python/Java, и обладают определенными инженерными способностями;
Знакомы с фреймворками глубокого обучения, такими как Tensorflow и PyTorch, и имеете практический опыт работы над проектами;
Знакомы с моделями НЛП, такими как RNN/CNN/Transformer/BERT/GPT, и имеете реальный проектный опыт;
Сильная целеустремленность, умение анализировать и обнаруживать проблемы, разбирать и упрощать, а также способность открывать новые пространства в повседневной работе;
Организованный и мотивированный, он может разобраться в сложной работе и создать эффективный механизм для продвижения сотрудничества вверх и вниз по течению для достижения целей.

бонус

Знаком с основными принципами каждого оптимизатора для обучения моделей и понимает основные методы и рамки распределенного обучения;
Иметь представление о новейших методах ускорения обучения, таких как обучение со смешанной точностью, обучение с низким битом, сжатие с распределенным градиентом и т. д.

Прочтите другие сборники технических статей от технической команды Meituan

|Отвечая на такие ключевые слова, как [акции 2020 г.], [акции 2019 г.], [акции 2018 г.] и [акции 2017 г.] в диалоговом окне строки меню общедоступной учетной записи, вы можете просмотреть коллекцию технических статей, подготовленных технической командой Meituan за эти годы. .

| Эта статья подготовлена технической командой Meituan, авторские права принадлежат Meituan. Добро пожаловать на перепечатку или использование содержимого этой статьи в некоммерческих целях, таких как обмен и общение, пожалуйста, укажите «Содержимое воспроизводится технической командой Meituan». Эта статья не может быть воспроизведена или использована в коммерческих целях без разрешения. Для любой коммерческой деятельности, пожалуйста, отправьте электронное письмо по адресу tech@meituan.comПодать заявку на авторизацию.