T

Trocr Base Spanish

由 qantev 开发
TrOCR基础版模型,专为西班牙语印刷字体设计,基于Transformer架构,在自建数据集上微调
下载量 170
发布时间 : 2/22/2024

模型简介

基于Transformer的光学字符识别模型,用于将印刷体图像转换为文本,不支持手写体识别

模型特点

西班牙语优化
在200万西班牙语样本的自建数据集上微调,专门优化西班牙语OCR性能
动态图像生成
训练过程中采用动态图像生成技术,相比预存图像方式效率更高
印刷体专用
专门针对印刷字体设计,不支持手写体识别

模型能力

印刷体图像转文本
西班牙语OCR
短文本识别(最多10个单词)

使用案例

文档数字化
维基百科内容提取
从西班牙语维基百科页面图像中提取文本内容
表单处理
XFUND数据集处理
处理西班牙语XFUND数据集中的表单图像
CER 0.0732 / WER 0.2028
AIbase
智启未来,您的人工智能解决方案智库
简体中文