T

Trocr Base Handwritten

由 microsoft 开发
TrOCR是一种基于Transformer的光学字符识别模型,专门用于手写文本识别。
下载量 206.74k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

TrOCR模型是一种编码器-解码器模型,结合了图像Transformer和文本Transformer,专门针对单行文本图像的光学字符识别任务进行了优化。

模型特点

基于Transformer架构
采用先进的Transformer架构,结合图像和文本处理能力
预训练模型微调
图像编码器基于BEiT预训练,文本解码器基于RoBERTa预训练
手写文本识别优化
专门在IAM手写数据集上进行了微调,适合手写文本识别

模型能力

手写文本识别
单行文本图像处理
光学字符识别

使用案例

文档数字化
手写笔记转录
将手写笔记转换为可编辑的文本格式
历史文档处理
历史手稿转录
数字化处理历史手写文档