D

Donut Demo

由 katanaml 开发
这是一个基于CORD-v2数据集微调的Donut模型,专为图像转文本任务设计,平均准确率达到0.901。
下载量 24
发布时间 : 1/18/2023
模型介绍
内容详情
替代品

模型简介

该模型主要用于从图像中提取文本信息,特别适用于文档图像识别和处理任务。

模型特点

高准确率
在CORD-v2数据集上达到0.901的平均准确率
文档图像处理
专门针对文档图像中的文本提取进行优化
基于Donut架构
利用先进的Donut模型架构进行图像到文本的转换

模型能力

文档图像识别
文本提取
图像转文本

使用案例

文档处理
收据识别
从收据图像中提取结构化文本信息
准确率0.901
表格提取
从文档图像中识别和提取表格内容
数据录入自动化
自动表单处理
将纸质表单转换为数字数据