N

Nougat Latex Base

由 Norm 开发
该模型是基于Nougat-base微调的LaTeX OCR模型,专门用于从图像生成LaTeX代码,特别优化了数学公式图像的识别能力。
下载量 8,523
发布时间 : 10/8/2023
模型介绍
内容详情
替代品

模型简介

基于Nougat的LaTeX模型通过调整输入分辨率和采用自适应填充方法,提升了从图像生成LaTeX代码的质量,特别适用于数学公式图像的识别。

模型特点

优化的输入分辨率
调整了输入分辨率并采用自适应填充方法,减少缩放伪影,提升LaTeX代码生成质量。
高性能LaTeX生成
在标记准确率和归一化编辑距离上优于同类模型pix2tex。
数学公式专用优化
专门针对数学公式图像片段进行优化,适合学术和技术文档处理。

模型能力

图像到LaTeX代码转换
数学公式识别
学术文档处理

使用案例

学术研究
论文公式提取
从学术论文图像中提取数学公式的LaTeX代码。
标记准确率62.38%,归一化编辑距离0.0618
教育
教学材料处理
将手写或印刷的数学公式转换为可编辑的LaTeX格式。