T

Trocr Large Stage1

由 microsoft 开发
TrOCR是一种基于Transformer的预训练模型,用于光学字符识别(OCR)任务。
下载量 3,700
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

TrOCR是一种编码器-解码器模型,由图像Transformer编码器和文本Transformer解码器组成,专门用于单行文本图像的光学字符识别。

模型特点

基于Transformer的架构
采用先进的Transformer架构,结合图像和文本处理能力。
预训练模型
模型权重已预训练,可直接使用或进行微调。
单行文本识别
专门优化用于单行文本图像的光学字符识别。

模型能力

图像转文本
光学字符识别
单行文本识别

使用案例

文档数字化
扫描文档识别
将扫描的文档图像转换为可编辑文本。
自动化处理
表单处理
自动识别和提取表单中的文本信息。