D

Donut Pdf Ocr

由 shubh1608 开发
基于图像文件夹数据集训练的OCR模型,用于PDF文档的文本识别
下载量 67
发布时间 : 4/17/2023
模型介绍
内容详情
替代品

模型简介

该模型是一个光学字符识别(OCR)模型,专门用于从PDF文档图像中提取文本内容。模型通过深度学习技术实现高精度文字识别。

模型特点

高精度OCR
在评估集上取得了0.0443的低损失值,表明模型具有较高的识别准确率
端到端训练
模型采用端到端训练方式,直接从图像到文本输出
PDF文档优化
专门针对PDF文档图像进行优化训练

模型能力

PDF文档图像文本识别
多格式文本输出
文档结构分析

使用案例

文档数字化
PDF文档转换
将扫描的PDF文档转换为可编辑的文本格式
高准确率的文本转换
自动化办公
文档信息提取
从合同、发票等文档中自动提取关键信息
提高数据处理效率