T

Trocr Base Stage1

由 microsoft 开发
TrOCR是基于Transformer的预训练光学字符识别模型,由微软团队开发,适用于单行文本图像的OCR任务。
下载量 18.74k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

TrOCR是一个编码器-解码器模型,结合了图像Transformer编码器和文本Transformer解码器,专为光学字符识别任务设计。

模型特点

基于Transformer架构
采用先进的Transformer架构,结合图像和文本处理能力
预训练模型
提供预训练权重,便于下游任务微调
单行文本识别
专门针对单行文本图像进行优化

模型能力

图像转文本
光学字符识别
单行文本识别

使用案例

文档数字化
扫描文档识别
将扫描文档中的单行文本转换为可编辑文本
图像处理
图像中的文本提取
从包含文本的图像中提取文字内容