Q

Qwen2.5 VL 3B Instruct GGUF

由 Mungert 开发
Qwen2.5-VL-3B-Instruct是一个3B参数规模的多模态模型,支持图文生成任务,特别优化了在llama.cpp中的视觉功能支持。
下载量 10.44k
发布时间 : 3/27/2025
模型介绍
内容详情
替代品

模型简介

该模型是一个结合视觉和语言能力的多模态模型,能够理解和生成与图像相关的文本内容。

模型特点

多模态支持
同时处理视觉和语言信息,实现图文交互
llama.cpp优化
特别适配llama.cpp分叉版本,支持视觉功能
超低位量化
支持IQ-DynamicGate超低位量化(1-2位),在保持性能的同时减少模型大小

模型能力

图像描述生成
视觉问答
多模态推理

使用案例

内容生成
图像描述
为输入的图像生成详细描述
生成符合图像内容的自然语言描述
视觉辅助
视觉问答
回答关于图像内容的问题
提供与图像相关的准确答案