Qwen2-VL-7B-Instruct-GGUF 开源多模态模型 - 支持图文联合理解与生成

首页

Qwen2 VL 7B Instruct GGUF

由 second-state 开发

Qwen2-VL-7B-Instruct 是一个多模态视觉语言模型，支持图像和文本的联合理解与生成任务。

图像生成文本英语开源协议:Apache-2.0 #多模态视觉问答 #128K长上下文 #量化高效推理

下载量 195

发布时间 : 12/15/2024

模型简介

基于Qwen2架构的7B参数视觉语言指令模型，能够处理图像和文本输入，生成相关文本输出。

模型特点

多模态理解

能够同时处理图像和文本输入，理解两者之间的关系

大上下文窗口

支持128000 tokens的上下文长度

量化支持

提供多种量化版本，适应不同硬件需求

模型能力

图像理解

文本生成

多模态推理

视觉问答

使用案例

内容理解

图像描述生成

根据输入图像生成详细的文字描述

视觉问答

回答关于图像内容的自然语言问题

多模态交互

基于图像的对话

结合图像和文本进行自然对话

🚀 Qwen2-VL-7B-Instruct-GGUF

本项目提供了Qwen2-VL-7B-Instruct模型的量化版本，可通过LlamaEdge运行，支持多模态的图像文本转换任务。

🚀 快速开始

原始模型

Qwen/Qwen2-VL-7B-Instruct

使用LlamaEdge运行

LlamaEdge版本：v0.16.0

提示模板

提示类型：qwen2-vision

提示字符串

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
<|vision_start|>{image_placeholder}<|vision_end|>{user_prompt}<|im_end|>
<|im_start|>assistant

上下文大小：128000

作为LlamaEdge服务运行

wasmedge --dir .:. \
  --nn-preload default:GGML:AUTO:Qwen2-VL-7B-Instruct-Q5_K_M.gguf \
  llama-api-server.wasm \
  --model-name Qwen2-VL-7B-Instruct \
  --prompt-template qwen2-vision \
  --llava-mmproj Qwen2-VL-7B-Instruct-vision-encoder.gguf \
  --ctx-size 128000

📦 量化的GGUF模型

名称	量化方法	比特数	大小	使用场景
Qwen2-VL-7B-Instruct-Q2_K.gguf	Q2_K	2	3.02 GB	最小，但质量显著下降，不推荐用于大多数场景
Qwen2-VL-7B-Instruct-Q3_K_L.gguf	Q3_K_L	3	4.09 GB	小，质量有较大损失
Qwen2-VL-7B-Instruct-Q3_K_M.gguf	Q3_K_M	3	3.81 GB	非常小，质量损失高
Qwen2-VL-7B-Instruct-Q3_K_S.gguf	Q3_K_S	3	3.49 GB	非常小，质量损失高
Qwen2-VL-7B-Instruct-Q4_0.gguf	Q4_0	4	4.43 GB	旧版本；小，质量损失非常高，建议使用Q3_K_M
Qwen2-VL-7B-Instruct-Q4_K_M.gguf	Q4_K_M	4	4.68 GB	中等，质量平衡，推荐使用
Qwen2-VL-7B-Instruct-Q4_K_S.gguf	Q4_K_S	4	4.46 GB	小，质量损失较大
Qwen2-VL-7B-Instruct-Q5_0.gguf	Q5_0	5	5.32 GB	旧版本；中等，质量平衡，建议使用Q4_K_M
Qwen2-VL-7B-Instruct-Q5_K_M.gguf	Q5_K_M	5	5.44 GB	大，质量损失非常低，推荐使用
Qwen2-VL-7B-Instruct-Q5_K_S.gguf	Q5_K_S	5	5.32 GB	大，质量损失低，推荐使用
Qwen2-VL-7B-Instruct-Q6_K.gguf	Q6_K	6	6.25 GB	非常大，质量损失极低
Qwen2-VL-7B-Instruct-Q8_0.gguf	Q8_0	8	8.21 GB	非常大，质量损失极低，不推荐使用
Qwen2-VL-7B-Instruct-f16.gguf	f16	16	15.2 GB
Qwen2-VL-7B-Instruct-vision-encoder.gguf	f16	16	2.70 GB

使用llama.cpp b4329进行量化

📄 许可证

本项目使用apache-2.0许可证。

属性	详情
基础模型	Qwen/Qwen2-VL-7B-Instruct
许可证	apache-2.0
模型创建者	Qwen
模型名称	Qwen2-VL-7B-Instruct
量化者	Second State Inc.
语言	en
任务类型	图像文本转换
标签	多模态
库名称	transformers