T

Trocr Large Handwritten

由 microsoft 开发
TrOCR是基于Transformer的光学字符识别模型,专为手写文本识别设计,在IAM数据集上进行了微调。
下载量 59.17k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

TrOCR是一个编码器-解码器模型,结合了图像Transformer和文本Transformer,适用于单行文本图像的光学字符识别任务。

模型特点

基于Transformer架构
采用先进的Transformer架构,结合图像和文本处理能力
预训练模型微调
图像编码器从BEiT初始化,文本解码器从RoBERTa初始化
手写文本识别优化
专门在IAM手写数据库上进行了微调,适合手写文本识别

模型能力

手写文本识别
单行文本图像OCR
英文文本提取

使用案例

文档数字化
手写笔记转录
将手写笔记图像转换为可编辑文本
高精度识别手写英文字符
历史文档处理
历史手稿转录
数字化处理历史手稿和档案
保留原始文档内容并转换为可搜索文本