E

Extract Matic

由 ssraut 开发
Sparrow是基于Donut ML基础模型在发票数据上微调的文档数据提取模型,旨在验证Donut在企业文档上的表现性能。
下载量 17
发布时间 : 6/3/2024
模型介绍
内容详情
替代品

模型简介

该模型专门用于从发票等企业文档中提取文本数据,具有高准确率的文档理解能力。

模型特点

高准确率发票处理
在测试集上达到0.96的平均准确率,能够可靠地从发票中提取关键信息
企业文档优化
专门针对企业文档(如发票)进行微调,优化了商业场景下的表现
基于Donut架构
利用Donut模型的强大视觉-语言理解能力,实现端到端的文档理解

模型能力

发票文本提取
文档图像理解
结构化数据输出

使用案例

财务自动化
发票信息提取
自动从发票图像中提取供应商、金额、日期等关键信息
测试准确率0.96
文档数字化
企业文档处理
将纸质发票等商业文档转换为结构化数字数据