A

Arabic Small Nougat

由 MohamedRashad 开发
专为阿拉伯语设计的端到端结构化光学字符识别系统,基于facebook/nougat-small架构微调
下载量 1,149
发布时间 : 2/17/2024

模型简介

该模型是一个端到端的阿拉伯语书籍结构化OCR系统,能够将阿拉伯语书籍图像转换为结构化文本(尤其是Markdown格式)。

模型特点

阿拉伯语OCR优化
专门针对阿拉伯语文本识别进行优化,能够处理阿拉伯语书籍的复杂排版
结构化输出
生成Markdown格式的结构化文本,保留原始文档的格式信息
端到端处理
直接从图像到文本的完整处理流程,无需中间步骤

模型能力

阿拉伯语文本识别
英语文本识别
书籍图像处理
Markdown格式生成

使用案例

文献数字化
阿拉伯古籍数字化
将阿拉伯语古籍图像转换为可编辑的数字化文本
实现古籍内容的电子化和可搜索化
印刷材料处理
阿拉伯语书籍扫描
处理扫描的阿拉伯语书籍页面,提取文本内容
生成结构化的电子书内容
AIbase
智启未来,您的人工智能解决方案智库
简体中文