T

Trocr Small Printed

由 microsoft 开发
TrOCR是一个基于Transformer的光学字符识别模型,适用于单行文本图像的OCR任务。
下载量 20.88k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

TrOCR模型是一个编码器-解码器模型,由图像Transformer作为编码器,文本Transformer作为解码器组成。该模型在SROIE数据集上进行了微调,专门用于印刷体文本识别。

模型特点

基于Transformer架构
采用Transformer编码器-解码器结构,结合了图像和文本处理能力
印刷体文本优化
专门针对印刷体文本进行了微调,识别效果更佳
端到端OCR
直接从图像到文本的端到端识别,无需复杂的预处理步骤

模型能力

印刷体文本识别
单行文本OCR
图像转文本

使用案例

文档数字化
收据识别
自动识别收据上的印刷体文本信息
高准确率的文本提取
发票处理
从发票图像中提取关键信息
提高数据处理效率
自动化办公
表格识别
识别印刷体表格中的文字内容
简化数据录入流程