E

Erax VL 7B V2.0 Preview

由 erax-ai 开发
EraX-VL-7B-V2.0-Preview是一款强大的多模态模型,专为OCR和视觉问答设计,擅长处理越南语等多种语言,在医疗表格、发票等文档识别上表现突出。
下载量 476
发布时间 : 1/11/2025
模型介绍
内容详情
替代品

模型简介

基于LLM的视觉大语言模型,专注于OCR和视觉问答任务,特别优化越南语处理能力,适用于医疗、保险等领域的文档分析。

模型特点

越南语优化
特别针对越南语进行优化,在越南语OCR和问答任务上表现优异
多模态能力
结合视觉和语言理解能力,可处理图像和文本的复杂交互
医疗文档分析
擅长分析医疗表格、处方、X光片等专业文档
事故分析
能够分析事故照片,描述损坏情况并提出修复建议

模型能力

图像文本识别
视觉问答
文档问答
医疗图像分析
多语言处理
事故照片分析

使用案例

医疗健康
放射学图像分析
分析X光片、CT或MRI图像,辅助诊断
能识别心脏CT扫描中的异常指标,提供初步诊断建议
处方识别
识别和解析医疗处方内容
准确提取处方中的药物和剂量信息
保险
事故评估
分析车祸照片评估损坏程度
详细描述损坏情况并提出修复建议
文档处理
发票识别
识别和提取发票中的关键信息
准确提取发票金额、日期等关键字段