D

Donut Base Sroie

由 philschmid 开发
基于naver-clova-ix/donut-base微调的文档理解模型,适用于图像文本提取任务
下载量 185
发布时间 : 9/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Donut架构的文档理解模型,专门针对图像中的文本信息提取任务进行了微调。适用于处理包含文本的图像文档,如收据、发票等。

模型特点

文档图像理解
专门针对文档图像(如收据、发票)的文本提取任务优化
基于Transformer架构
采用Donut架构,结合视觉和语言处理能力
端到端处理
直接从图像输入到文本输出,无需中间OCR步骤

模型能力

文档图像文本提取
收据信息识别
发票数据抽取

使用案例

商业文档处理
收据信息提取
从扫描或拍摄的收据中自动提取关键信息
发票数据处理
自动识别发票中的金额、日期、供应商等信息