O

Olmocr 7B 0225 Preview

由 FriendliAI 开发
基于Qwen2-VL-7B-Instruct微调的文档OCR模型,支持多语言文档识别与元数据提取
下载量 322
发布时间 : 2/28/2025
模型介绍
内容详情
替代品

模型简介

该模型是针对文档OCR任务优化的多模态模型,能够处理单页文档图像并提取文本内容及文档结构信息。

模型特点

多模态文档理解
结合视觉与语言模型能力,同时处理图像和文本信息
元数据提取
可识别文档语言、旋转校正、表格/图表检测等结构化信息
高效推理支持
通过sglang框架支持海量文档批量处理

模型能力

文档图像识别
多语言文本提取
文档结构分析
元数据生成
表格检测
图表检测

使用案例

学术研究
论文数字化
将学术论文PDF转换为结构化数字内容
提取文本内容及论文元数据
企业文档处理
合同解析
自动识别合同文档中的关键条款和结构
生成结构化合同数据