Введение в пространство
spacy是世界上最快的工业级自然语言处理工具。 支持多种自然语言处理基本功能。
官网地址:spacy.io/
spacy主要功能包括分词、词性标注、词干化、命名实体识别、名词短语提取等等。
spacy是一个python开源模块(扩展包),用于自然语言处理。
在目前来说,spacy号称是速度最快、更加适合实际应用的工业级产品。
spacy可以帮助你进行信息提取、自然语言理解以及深度学习的预处理。
Установить
pip install spacy
Скачать языковые пакеты
语言包主要有中文和英文的,
python -m spacy download zh_core_web_sm # 中文包
python -m spacy download en_core_web_sm # 英文包
使用:
spacy.load('en_core_web_sm')