O

OCR LayoutLMv3 Invoice

由 jinhybr 开发
基于LayoutLMv3-base微调的发票识别模型,在wild_receipt数据集上训练,擅长从发票中提取结构化信息。
下载量 340
发布时间 : 11/7/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对发票文本识别优化的OCR模型,能够准确识别和分类发票中的各类信息字段。

模型特点

高精度发票识别
在wild_receipt数据集上达到87.65%的精确率和88.12%的召回率
基于LayoutLMv3架构
利用先进的视觉-语言预训练模型,结合文本和布局信息进行识别
端到端训练
直接从原始发票图像中学习文本和布局特征

模型能力

发票文本识别
结构化信息提取
票据字段分类

使用案例

财务自动化
发票信息提取
自动从各类发票中提取关键信息如金额、日期、商家等
准确率92.68%,F1值87.89%
企业报销
报销单处理
自动识别和分类报销单据中的各项费用