Q

Qwen For Jawi V1

由 culturalheritagenus 开发
基于Qwen2-VL-2B-Instruct微调的爪夷文OCR模型,专门用于识别历史马来文本
下载量 155
发布时间 : 10/3/2024
模型介绍
内容详情
替代品

模型简介

该模型是针对爪夷文(阿拉伯字母书写的马来语)历史文献的光学字符识别(OCR)任务而优化的视觉-语言模型,主要用于文化遗产数字化保存和历史文本分析

模型特点

爪夷文专用OCR
针对历史马来文献中的爪夷文字符识别进行专门优化
文化遗产保护
支持马来文化遗产的数字化保存工作
性能优势
相比通用阿拉伯语OCR模型,在爪夷文识别上具有显著优势

模型能力

图像文字识别
历史文献数字化
爪夷文转写

使用案例

文化遗产保护
历史文献数字化
将爪夷文书写的马来历史文献转换为可编辑文本
CER 8.66%,WER 25.50%
学术研究
历史文本分析
支持对爪夷文历史文本的计算分析