Сверхлегкий китайский OCR

глубокое обучение

Программно-аппаратная среда

  • ubuntu 18.04 64bit
  • CUDA 10.1
  • chineseocr_lite
  • anaconda with python 3.7
  • pytorch

Введение

chineseocr_liteэто проект с открытым исходным кодом, который используетc++иpythonЯзык разработки используется для реализации распознавания китайского текста и поддерживает вертикальное распознавание текста и традиционное распознавание.17M(это очень мало), поддерживаяCPUиGPU, проект объединяетwebСреда также очень удобна для развертывания.

Базовая установка и использование

Скачиваем исходники с официального сайта, далее используемcondaсоздать новыйpythonВиртуальная среда, начните установку после активации виртуальной средыchineseocr_lite, соответствующая команда выглядит следующим образом

git clone https://github.com/ouyanghuiyu/chineseocr_lite.git
cd chinesesocr_lite
conda create -n ocr python=3.7
conda activate ocr
pip install torch torchvision
pip install -r requirements.txt
pip install -U web.py
cd psenet/pse/
rm pse.so
make
python app.py 8090

Здесь следует отметить,requirements.txtуказано вweb.pyВерсия сообщит об ошибке при запуске, но после обновления все будет в порядке.

На данный момент проект установлен, входим в браузерhttp://127.0.0.1:8090/ocr

Видно, что вертикальный текст также в основном распознается.

Используйте ускорение графического процессора

приходитьpytorchсайт,py torch.org/individual-started…, выберите в соответствии с вашей средой, и, наконец, веб-сайт выдаст соответствующую команду установки, что очень хорошо

pip install torch==1.5.0+cu101 torchvision==0.6.0+cu101 -f https://download.pytorch.org/whl/torch_stable.html

После установки приходим кipythonпроверять

Начать сначалаwebСлужить,deviceВывод этого блока, если вы видитеcudaвместоcpu, значит можно использоватьgpuохватывать


(ocr) xugaoxiang@1070Ti:~/Works/github/chineseocr_lite$ python app.py 8090
make: Entering directory '/home/xugaoxiang/Works/github/chineseocr_lite/psenet/pse'
make: 'pse.so' is up to date.
make: Leaving directory '/home/xugaoxiang/Works/github/chineseocr_lite/psenet/pse'
device: cuda:0
load model
device: cuda:0
load model
device: cuda:0
load model
device: cuda:0
load model
http://0.0.0.0:8090/

После проверки та же картина.gpuИдентификация занимает только времяcpu1/3, эффект все еще хороший

использованная литература