Erax VL 2B V1.5 Q4 K M GGUF

E

Erax VL 2B V1.5 Q4 K M GGUF

由 Ngoac 开发

这是一个多模态视觉问答模型，支持越南语、英语和中文，基于erax-ai/EraX-VL-2B-V1.5转换的GGUF格式版本。

文本生成图像支持多种语言开源协议:Apache-2.0 #多模态视觉问答 #越南语OCR支持 #保险单据解析

下载量 55

发布时间 : 1/2/2025

模型简介

该模型是一个视觉问答(VQA)模型，能够处理图像和文本输入，生成相关答案。特别适用于保险、光学字符识别(OCR)等场景。

模型特点

多语言支持

支持越南语、英语和中文三种语言的视觉问答任务

GGUF格式优化

转换为GGUF格式，便于在llama.cpp等工具上高效运行

多模态能力

能够同时处理图像和文本输入，进行跨模态理解

行业应用优化

特别针对保险和OCR等应用场景进行了优化

模型能力

视觉问答

图像理解

多语言处理

文本生成

使用案例

保险

保险单据处理

自动识别和分析保险单据中的信息

医疗

处方识别

识别医疗处方中的文字和内容

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24