N

Nougat Small

由 facebook 开发
Nougat是基于Donut架构的视觉-语言模型,专为将科学PDF转换为Markdown格式而设计。
下载量 10.28k
发布时间 : 9/21/2023
模型介绍
内容详情
替代品

模型简介

该模型采用Swin Transformer作为视觉编码器和mBART作为文本解码器,能够通过自回归方式直接从PDF图像像素预测Markdown文本。

模型特点

PDF到Markdown转换
专门针对科学PDF文档设计,可将其转换为易用的Markdown格式
端到端处理
直接从PDF图像像素预测文本,无需中间OCR步骤
学术文档优化
针对学术文档中的数学公式、表格等复杂结构进行了优化

模型能力

PDF文档解析
Markdown生成
学术文档处理
数学公式识别
表格提取

使用案例

学术研究
论文格式转换
将学术论文PDF转换为可编辑的Markdown格式
便于研究人员编辑和重用论文内容
文献数字化
将扫描版科学文献转换为结构化数字文档
提高文献可搜索性和可访问性
出版行业
文档格式转换
将传统PDF出版物转换为现代Markdown格式
便于多平台发布和内容管理