Donut Pdf Ocr

D

Donut Pdf Ocr

由 shubh1608 开发

基于图像文件夹数据集训练的OCR模型，用于PDF文档的文本识别

#PDF文档OCR #高精度文本识别 #图像转文本

下载量 67

发布时间 : 4/17/2023

模型简介

该模型是一个光学字符识别(OCR)模型，专门用于从PDF文档图像中提取文本内容。模型通过深度学习技术实现高精度文字识别。

模型特点

高精度OCR

在评估集上取得了0.0443的低损失值，表明模型具有较高的识别准确率

端到端训练

模型采用端到端训练方式，直接从图像到文本输出

PDF文档优化

专门针对PDF文档图像进行优化训练

模型能力

PDF文档图像文本识别

多格式文本输出

文档结构分析

使用案例

文档数字化

PDF文档转换

将扫描的PDF文档转换为可编辑的文本格式

高准确率的文本转换

自动化办公

文档信息提取

从合同、发票等文档中自动提取关键信息

提高数据处理效率

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24