基于Donut架构微调的发票信息提取模型,免OCR实现文档理解
下载量 70
发布时间 : 5/24/2023
模型简介
该模型针对发票处理场景进行优化,能够自动从发票中提取供应商信息、账单明细、金额等关键字段,无需依赖OCR技术。
模型特点
免OCR处理
直接处理图像输入,无需传统OCR预处理步骤
发票专用优化
针对发票文档结构进行专门微调,提升关键字段提取准确率
端到端训练
从图像到结构化数据的端到端训练流程
模型能力
发票图像理解
结构化信息提取
关键字段识别
文档布局分析
使用案例
财务自动化
应付账款处理
自动从供应商发票中提取账单信息,加速应付账款流程
减少人工数据录入错误,提高处理效率
费用报销审核
解析员工提交的发票,自动提取金额、日期等关键信息
简化报销流程,提高审核准确性
文档数字化
历史发票归档
将纸质发票数字化并提取结构化数据
便于后续检索和分析
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文