E

Erax VL 7B V1.5

由 mxw1998 开发
EraX-VL-7B-V1.5是一款强大的多模态模型,专精于光学字符识别(OCR)和视觉问答(VQA),在多语言环境下表现卓越,尤其擅长越南语。
下载量 26
发布时间 : 4/23/2025
模型介绍
内容详情
替代品

模型简介

基于Qwen/Qwen2-VL-7B-Instruct微调的多模态模型,擅长文档识别、视觉问答和多轮推理,特别优化了越南语处理能力。

模型特点

卓越的越南语OCR能力
针对越南语文档(如医疗表格、发票、身份证等)进行了优化,识别精度高
多轮视觉问答
支持基于图像的复杂多轮问答和推理
多语言支持
除越南语外,还支持英语和中文处理
开源模型
基于Apache 2.0许可证开源,可自由使用和修改

模型能力

文档信息提取
图像内容描述
多轮视觉问答
多语言文本识别
医疗表格处理
商业单据分析

使用案例

医疗健康
医疗处方识别
从医疗处方中提取患者信息、药品清单和剂量
准确识别越南语医疗文档中的关键信息
体检报告分析
解析体检报告中的各项指标和诊断结果
结构化输出体检数据
金融服务
发票处理
自动识别发票中的金额、税号和商品信息
提高财务处理效率
身份验证
从身份证件中提取个人信息
简化KYC流程
政府服务
证件处理
处理各类政府证件如驾驶证、车辆登记证等
自动化证件信息录入