I

Im2latex

由 DGurgurov 开发
基于VisionEncoderDecoderModel的基准模型,针对从图像生成LaTeX公式的数据集进行了微调。
下载量 288
发布时间 : 7/15/2024
模型介绍
内容详情
替代品

模型简介

该模型能够将包含数学公式的图像转换为LaTeX代码,适用于学术文档处理和数学公式识别等场景。

模型特点

混合架构
结合视觉编码器(Swin Transformer)和文本解码器(GPT-2),有效处理图像到文本的转换任务
高精度公式识别
在测试集上达到0.67的BLEU分数,能够准确识别复杂数学公式
分布式训练
使用PyTorch的分布式数据并行(DDP)进行高效训练

模型能力

图像识别
数学公式转换
LaTeX代码生成

使用案例

学术研究
论文公式数字化
将扫描文档或图片中的数学公式转换为可编辑的LaTeX代码
提高学术文档处理效率
教育辅助工具
帮助学生和教师快速获取图片中公式的LaTeX表示
便于数学内容共享和教学
文档处理
PDF公式提取
从PDF文档中提取公式图像并转换为可编辑格式
简化文档编辑流程