краткое введение
Пользователи загружают фотографии, которые необходимо идентифицировать, партиями. После успешной загрузки система запускает фоновое задание Hangfire и начинает вызывать службу PaddleOCR для возврата результатов. Этот процесс чем-то похож на архитектурную модель микросервисов.
PaddleOCR
PaddleOCR — это проект с открытым исходным кодом команды Baidu AI, который должен быть лучшим эффектом распознавания среди всех бесплатных проектов OCR с открытым исходным кодом.PaddleOCRПоймите, если у вас нет опыта разработки на Python, вы можете столкнуться с некоторыми проблемами в развертывании среды, но вы почти можете найти решения.
Demo razor.i247365.net/invoices/in…
- Пользователи загружают файлы для распознавания в пакетном режиме. Поскольку моя виртуальная машина имеет очень низкую производительность, я могу загрузить системный фон и автоматически распознать его в первую очередь.
2. После завершения распознавания система автоматически уведомит пользователя и изменит статус, и пользователь сможет просмотреть результат распознавания.
Рабочая среда
- .net 5.0>
- Python 3.7>
- ASP.NET Core Razor Page Application 5.0 Исходная ветвь (features\invoice_ocr)RazorPageCleanArchitecture\features\invoice_ocr
- Веб-API PaddleOCR (облачный хост CentOS Alibaba)PaddlePaddle/PaddleOCR
- Hangfire Dashboard HangfireIO/Hangfire
стек технологий
- ASP.NET Core
- Jquery/Javascript
- EasyUI
- Python
Установите среду PaddleOCR
PaddleOCR был протестирован для работы с glibc 2.23, вы также можете протестировать другие версии glibc или установить glic 2.23. Рабочая среда PaddleOCR
- PaddlePaddle 2.0.0
- python3.7
- glibc 2.23
- cuDNN 7.6+ (GPU)
Для запуска PaddleOCR рекомендуется использовать предоставленный нами докер.Информацию об использовании докеров и nvidia-docker см.Ссылка на сайт.
Если вы хотите запустить код прогнозирования напрямую с помощью Mac или Windows, вы можете начать с шага 2.
1. (Рекомендуется) Подготовьте среду докера. При первом использовании этого изображения оно будет загружено автоматически, проявите терпение.
# 切换到工作目录下
cd /home/Projects
# 首次运行需创建一个docker容器,再次运行时不需要运行当前命令
# 创建一个名字为ppocr的docker容器,并将当前目录映射到容器的/paddle目录下
如果您希望在CPU环境下使用docker,使用docker而不是nvidia-docker创建docker
sudo docker run --name ppocr -v $PWD:/paddle --network=host -it paddlepaddle/paddle:latest-dev-cuda10.1-cudnn7-gcc82 /bin/bash
如果使用CUDA10,请运行以下命令创建容器,设置docker容器共享内存shm-size为64G,建议设置32G以上
sudo nvidia-docker run --name ppocr -v $PWD:/paddle --shm-size=64G --network=host -it paddlepaddle/paddle:latest-dev-cuda10.1-cudnn7-gcc82 /bin/bash
您也可以访问[DockerHub](https://hub.docker.com/r/paddlepaddle/paddle/tags/)获取与您机器适配的镜像。
# ctrl+P+Q可退出docker 容器,重新进入docker 容器使用如下命令
sudo docker container exec -it ppocr /bin/bash
2. Установите PaddlePaddle 2.0
pip3 install --upgrade pip
如果您的机器安装的是CUDA9或CUDA10,请运行以下命令安装
python3 -m pip install paddlepaddle-gpu==2.0.0 -i https://mirror.baidu.com/pypi/simple
如果您的机器是CPU,请运行以下命令安装
python3 -m pip install paddlepaddle==2.0.0 -i https://mirror.baidu.com/pypi/simple
更多的版本需求,请参照[安装文档](https://www.paddlepaddle.org.cn/install/quick)中的说明进行操作。
3. Клонируйте код репозитория PaddleOCR.
【推荐】git clone https://github.com/PaddlePaddle/PaddleOCR
如果因为网络问题无法pull成功,也可选择使用码云上的托管:
git clone https://gitee.com/paddlepaddle/PaddleOCR
注:码云托管代码可能无法实时同步本github项目更新,存在3~5天延时,请优先使用推荐方式。
4. Установите сторонние библиотеки
cd PaddleOCR
pip3 install -r requirements.txt
**如果有问题可以留言,我会帮你处理**
## 重点代码分析
httpClient调用PaddleOCR API
开始自动失败重试策略
```js
services.AddHttpClient("ocr", c =>
{
c.BaseAddress = new Uri("https://paddleocr.i247365.net/predict/ocr_system");
c.DefaultRequestHeaders.Accept.Add(new MediaTypeWithQualityHeaderValue("application/json"));
})
.AddTransientHttpErrorPolicy(policy => policy.WaitAndRetryAsync(3, _ => TimeSpan.FromMilliseconds(1000))); ;
public void Recognition(int id)
{
using (var client = _httpClientFactory.CreateClient("ocr"))
{
var invoice = _context.Invoices.Find(id);
var imgfile = Path.Combine(Directory.GetCurrentDirectory(), invoice.AttachmentUrl);
var bytes = File.ReadAllBytes(imgfile);
string base64string = Convert.ToBase64String(bytes);
var response = client.PostAsJsonAsync<dynamic>("", new { images = new string[] { base64string } }).Result;
}
Console.WriteLine($"{id}, completed.");
}
Анализ информации о счете, в настоящее время все еще использующий относительно глупый метод, с использованием регулярных выражений для сопоставления обязательных полей, таких как сумма счета, дата счета, номер счета и т. д., потому что это бесплатно и не обеспечивает более интеллектуального сопоставления, такого как услуги по оплате, Здесь я думаю, что пока данных достаточно, также должна быть возможность добиться более интеллектуального распознавания посредством самообучения. Поэтому я оставил поле «Метка», цель состоит в том, чтобы вручную сформулировать соответствующее поле поля, а затем обучить данные координат.
if(response.StatusCode== System.Net.HttpStatusCode.OK)
{
var result = response.Content.ReadAsStringAsync().Result;
var ocr_result = JsonSerializer.Deserialize<ocr_result>(result);
var ocr_status = "";
invoice.Status = "Done";
invoice.Result = ocr_result.status;
if (ocr_result.status== "000")
{
foreach(var collection in ocr_result.results)
{
foreach(var item in collection)
{
var rawdata = new InvoiceRawData()
{
Confidence=item.confidence,
InvoiceId=id,
Text=item.text,
Text_Region= JsonSerializer.Serialize(item.text_region)
};
if (item.text.Contains("发票号码"))
{
var regex = new Regex("\\d*$");
var mc = regex.Match(item.text);
if(mc.Success)
{
invoice.InvoiceNo = mc.Value;
}
}
if (item.text.Contains("开票日期"))
{
var regex = new Regex("\\d{4}年\\d{2}月\\d{2}日");
var mc = regex.Match(item.text);
if (mc.Success)
{
invoice.InvoiceDate = Convert.ToDateTime(mc.Value.Replace("年","/").Replace("月", "/").Replace("日", ""));
}
}
if (item.text.Contains("%"))
{
var regex = new Regex("^\\d*.\\d*");
var mc = regex.Match(item.text);
if (mc.Success)
{
invoice.TaxRate = decimal.Parse(mc.Value);
}
}
if (item.text.Contains("¥"))
{
var regex = new Regex("\\d.\\d*");
var mc = regex.Match(item.text);
if (mc.Success)
{
invoice.Amount = decimal.Parse(mc.Value);
}
}
_context.InvoiceRawDatas.Add(rawdata);
}
}
ocr_status = ocr_result.status;
}
_context.SaveChangesAsync(default).Wait();
_hubContext.Clients.All.SendAsync(SignalR.OCRTaskCompleted, new { invoiceNo = invoice.InvoiceNo });
}
Результаты распознавания аннотаций рамки холста
data.map((item,index) => {
$('#rawdata_table > tbody').append(`<tr><td>${index + 1}</td><td>${item.Text}</td><td></td></tr>`);
var points = JSON.parse(item.Text_Region);
ctx.lineWidth = "5";
ctx.strokeStyle = "#00ff00";
ctx.textAlign = 'left';
ctx.textBaseline = 'top';
ctx.fillStyle = "#ff0000";
ctx.font = "bold 13px verdana, sans-serif ";
ctx.fillText(item.Text, points[0][0], points[0][1]-15);
ctx.beginPath();
ctx.moveTo(points[0][0], points[0][1]);
ctx.lineTo(points[1][0], points[1][1]);
ctx.lineTo(points[2][0], points[2][1]);
ctx.lineTo(points[3][0], points[3][1]);
ctx.closePath();
ctx.stroke();
});
Разве это не просто и круто
Наконец
Дай звезду! ⭐
If you like or are using this project please give it a star. Thanks! RazorPageCleanArchitecture\features\invoice_ocr