Q

Qari OCR 0.2.2.1 VL 2B Instruct

由 NAMAA-Space 开发
基于Qwen2-VL-2B-Instruct微调的阿拉伯语OCR模型,专为整页阿拉伯文本识别优化,支持变音符号识别
下载量 2,382
发布时间 : 3/26/2025
模型介绍
内容详情
替代品

模型简介

本模型是针对阿拉伯语OCR任务优化的视觉语言模型,能高精度提取整页阿拉伯文本,特别擅长识别包含变音符号的文本。

模型特点

卓越准确率
在阿拉伯语OCR任务中达到顶尖性能指标
音标支持
完整识别阿拉伯语变音符号(tashkeel),包括各种发音符号形式
多字体兼容
支持多种阿拉伯语字体样式
版式适应
能处理不同文档布局和格式

模型能力

阿拉伯语文本识别
变音符号识别
多字体处理
整页文档OCR

使用案例

文档数字化
古籍数字化
将阿拉伯语古籍转换为可编辑文本
准确保留原版变音符号和排版
表格处理
识别阿拉伯语表格文档
保持表格结构和内容完整性
教育应用
教材扫描
将阿拉伯语教材转换为电子文本
准确识别教学用变音符号