学术文档处理

# 学术文档处理

PP FormulaNet Plus M

PP-FormulaNet_plus-M 是由 PaddleOCR 团队开发的增强版公式识别模型，支持中文公式识别，并提升了对复杂公式的处理能力。

文字识别支持多种语言

PP FormulaNet Plus L

PP-FormulaNet_plus-L 是 PaddleOCR 团队开发的增强版公式识别模型，支持中文公式识别，最大标记数提升至2560，适用于复杂公式场景。

文字识别支持多种语言

基于图像生成LaTeX公式的VisionEncoderDecoder模型，使用Swin Transformer编码器和GPT-2解码器架构

图像生成文本

基于VisionEncoderDecoderModel的基准模型，针对从图像生成LaTeX公式的数据集进行了微调。

图像生成文本

一个预训练的TrOCR模型，专门用于Typst公式OCR任务，能够将图像中的数学公式转换为文本格式。

一个专注于识别中英文混合LaTeX公式的OCR模型，支持本地离线CPU推理

图像生成文本

Pix2Text的数学公式检测(MFD)模型，用于识别图片中的数学公式

文字识别其他

Cephalo LaTeX Phi 3 Vision 128k 4b Beta

Cephalo是一个专注于多模态材料科学的视觉大语言模型系列，当前版本专精于将数学公式图像转换为LaTeX代码。

图像生成文本

TexTeller是基于ViT架构的端到端公式识别模型，能够识别自然图像中的数学公式并将其转换为LaTeX格式公式。

Nougat For Formula

基于Nougat-small微调的数学公式识别模型，擅长从图像中提取LaTeX公式代码

图像生成文本

Texify 是一个 OCR 工具，专门用于将公式图片和文本转换为 LaTeX 格式。

Nougat Latex Base

该模型是基于Nougat-base微调的LaTeX OCR模型，专门用于从图像生成LaTeX代码，特别优化了数学公式图像的识别能力。

图像生成文本

Transformers 英语

Nougat是基于Donut架构的视觉-语言模型，专为将科学PDF转换为Markdown格式而设计。

图像生成文本

Nougat是基于Donut架构的模型，专为将科学PDF转录为易用Markdown格式而训练

图像生成文本

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24