N

Nanonets OCR S GGUF

由 unsloth 开发
Nanonets-OCR-s是一款先进的图像转Markdown光学字符识别(OCR)模型,能够将文档转换为结构化的Markdown格式,具备智能内容识别和语义标记功能。
下载量 2,300
发布时间 : 6/16/2025

模型简介

Nanonets-OCR-s是一款强大的OCR模型,专为将文档转换为结构化的Markdown格式而设计。它不仅能够提取文本,还能识别和标记LaTeX公式、图像、签名、水印等复杂内容,非常适合供大语言模型(LLM)进行下游处理。

模型特点

LaTeX公式识别
自动将数学方程和公式转换为格式正确的LaTeX语法,可区分行内公式和显示公式。
智能图像描述
使用结构化的<img>标签描述文档内的图像,便于大语言模型处理。
签名检测与分离
识别并分离文档中的签名,将其输出到<signature>标签内。
水印提取
检测并提取文档中的水印文本,将其放置在<watermark>标签内。
智能复选框处理
将表单中的复选框和单选按钮转换为标准化的Unicode符号。
复杂表格提取
准确提取文档中的复杂表格,并将其转换为Markdown和HTML表格格式。

模型能力

文档OCR
LaTeX公式识别
图像内容描述
签名检测
水印提取
表格提取
复选框处理

使用案例

文档处理
学术论文处理
将包含数学公式和表格的学术论文转换为结构化Markdown格式。
保留原始文档的结构和语义,便于后续分析和处理。
商业合同处理
提取合同中的文本、签名和水印信息。
自动化处理法律文档,提高效率。
表单处理
识别和转换表单中的复选框和单选按钮。
标准化表单数据,便于后续分析。
AIbase
智启未来,您的人工智能解决方案智库
简体中文