N

Nanonets OCR S GGUF

由 Mungert 开发
Nanonets-OCR-s是一款强大的图像转Markdown的OCR模型,能够将文档转换为结构化的Markdown并进行智能内容识别和语义标记。
下载量 1,044
发布时间 : 6/14/2025

模型简介

Nanonets-OCR-s是一款先进的OCR模型,专为将文档转换为结构化的Markdown设计。它不仅能够提取文本,还能识别和标记复杂的内容,如表格、公式、图像、签名和水印等,非常适合大语言模型(LLM)的下游处理。

模型特点

LaTeX公式识别
自动将数学公式转换为格式正确的LaTeX语法,区分行内公式和显示公式。
智能图像描述
使用结构化的<img>标签描述文档中的图像,使其易于被大语言模型处理。
签名检测与隔离
识别并隔离签名与其他文本,将其输出到<signature>标签中,适用于法律和商业文档。
水印提取
检测并从文档中提取水印文本,将其放置在<watermark>标签中。
智能复选框处理
将表单复选框和单选按钮转换为标准化的Unicode符号(☐, ☑, ☒),以便进行一致且可靠的处理。
复杂表格提取
准确地从文档中提取复杂表格,并将其转换为Markdown和HTML表格格式。

模型能力

文档转换
文本提取
表格识别
公式识别
图像描述
签名检测
水印提取
复选框处理

使用案例

文档处理
PDF转Markdown
将PDF文档转换为结构化的Markdown格式,保留原始文档的布局和内容。
生成易于处理和编辑的Markdown文档。
表格提取
从文档中提取复杂表格并转换为HTML或Markdown格式。
保留表格的结构和内容,便于后续处理。
学术研究
公式识别
识别文档中的数学公式并转换为LaTeX语法。
便于学术论文的编辑和排版。
商业文档
签名检测
识别和隔离文档中的签名部分。
便于法律和商业文档的处理。
水印提取
检测和提取文档中的水印文本。
便于文档的版权管理和验证。
AIbase
智启未来,您的人工智能解决方案智库
简体中文