I

Im2latex Base

由 Matthijs0 开发
基于图像生成LaTeX公式的VisionEncoderDecoder模型,使用Swin Transformer编码器和GPT-2解码器架构
下载量 56
发布时间 : 1/14/2025
模型介绍
内容详情
替代品

模型简介

该模型能够将包含数学公式的图像转换为LaTeX代码,适用于学术文档、技术报告等场景的公式数字化处理

模型特点

混合架构设计
结合视觉编码器(Swin Transformer)和文本解码器(GPT-2)的优势,有效处理图像到文本的转换任务
高精度公式识别
在测试集上达到0.69的BLEU分数,能够准确识别和转换复杂的数学公式
可扩展性
支持后续对手写公式数据进行微调,提升模型在特定场景下的表现

模型能力

图像识别
数学公式转换
LaTeX代码生成

使用案例

学术研究
论文公式数字化
将纸质或PDF文档中的数学公式转换为可编辑的LaTeX代码
提高学术写作效率,便于公式复用和修改
教育技术
在线学习平台
帮助学生和教师快速输入复杂的数学公式
简化在线数学内容的创作流程