T

Trocr Small Photomath

由 vukpetar 开发
TrOCR是基于Transformer的光学字符识别模型,专为数学表达式识别微调,采用编码器-解码器架构,结合BEiT图像编码器和RoBERTa文本解码器。
下载量 389
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型用于单行文本图像的光学字符识别(OCR),特别针对数学表达式进行了优化。

模型特点

数学表达式专用
针对数学表达式识别进行专门微调,适合处理公式和符号
Transformer架构
采用先进的Transformer架构,结合视觉和语言处理能力
预训练模型微调
基于BEiT和RoBERTa预训练模型,具有强大的迁移学习能力

模型能力

单行文本识别
数学表达式识别
图像到文本转换

使用案例

教育技术
数学作业批改
自动识别学生手写或打印的数学公式
提高批改效率,减少人工错误
文档数字化
科技论文处理
将包含数学公式的纸质文档转换为可编辑文本
便于文档检索和内容分析