E

Erax VL 2B V1.5 Q4 K M GGUF

由 Ngoac 开发
这是一个多模态视觉问答模型,支持越南语、英语和中文,基于erax-ai/EraX-VL-2B-V1.5转换的GGUF格式版本。
下载量 55
发布时间 : 1/2/2025
模型介绍
内容详情
替代品

模型简介

该模型是一个视觉问答(VQA)模型,能够处理图像和文本输入,生成相关答案。特别适用于保险、光学字符识别(OCR)等场景。

模型特点

多语言支持
支持越南语、英语和中文三种语言的视觉问答任务
GGUF格式优化
转换为GGUF格式,便于在llama.cpp等工具上高效运行
多模态能力
能够同时处理图像和文本输入,进行跨模态理解
行业应用优化
特别针对保险和OCR等应用场景进行了优化

模型能力

视觉问答
图像理解
多语言处理
文本生成

使用案例

保险
保险单据处理
自动识别和分析保险单据中的信息
医疗
处方识别
识别医疗处方中的文字和内容