N

Nougat Base

由 Xenova 开发
Nougat是一个基于视觉的学术文档理解模型,能够将科学PDF图像转换为Markdown格式文本。
下载量 24
发布时间 : 11/10/2023
模型介绍
内容详情
替代品

模型简介

Nougat是一个专注于学术文档的神经光学理解系统,主要用于将包含科学内容的PDF图像转换为结构化的Markdown文本。

模型特点

学术文档理解
专门针对科学PDF文档设计,能够准确解析复杂的学术内容
图像转Markdown
将PDF图像直接转换为结构化的Markdown格式文本
Web兼容
提供ONNX格式权重,适合在Web环境中使用

模型能力

PDF图像解析
学术文本识别
Markdown格式转换
科学文档处理

使用案例

学术研究
论文数字化
将扫描的学术论文转换为可编辑的Markdown格式
保留原始论文的结构和内容
科学文档处理
自动处理包含数学公式和特殊符号的科学文档
准确识别复杂的学术内容
文档管理
PDF内容提取
从PDF图像中提取结构化文本内容
生成易于处理的Markdown格式