F

Finetune Donut Cord V2.5

由 fahmiaziz 开发
这是一个基于Donut架构的视觉语言模型,专门针对CORD-V2数据集进行微调,用于文档图像转文本任务。
下载量 97
发布时间 : 9/12/2023

模型简介

该模型能够从文档图像中提取结构化文本信息,特别适用于收据、表格等文档的自动识别和转换。

模型特点

高准确率
在CORD-V2数据集上达到90%的准确率
文档理解
专门针对文档图像优化,能处理复杂的文档布局
端到端处理
直接从图像输入到结构化文本输出,无需中间处理步骤

模型能力

文档图像识别
文本提取
结构化数据转换
收据信息提取

使用案例

文档数字化
收据处理
自动从收据图像中提取商家、日期、金额等信息
准确率90%
表格识别
将纸质表格转换为结构化电子数据
办公自动化
文档归档
自动为扫描文档生成可搜索的文本内容
AIbase
智启未来,您的人工智能解决方案智库
简体中文