Qwen2.5-VL-7B-Instruct-4bit开源多模态模型 - 免费部署，训练速度提升2倍

首页

Qwen2.5 VL 7B Instruct 4bit

由 jarvisvasu 开发

基于Qwen2.5-VL-7B-Instruct模型微调的多模态模型，采用Unsloth加速框架和TRL库训练，速度提升2倍

文本生成图像

Transformers

英语开源协议:Apache-2.0 #多模态指令理解 #Unsloth加速训练 #视觉语言推理

下载量 180

发布时间 : 1/29/2025

模型简介

这是一个支持视觉-语言任务的多模态模型，能够处理图像和文本的联合输入，适用于多模态理解和生成任务

模型特点

Unsloth加速框架

采用Unsloth加速框架，训练速度提升2倍

TRL训练库

使用Huggingface的TRL库进行训练

多模态能力

支持视觉和语言联合输入与处理

模型能力

文本生成

图像理解

多模态推理

指令跟随

使用案例

多模态应用

图像描述生成

根据输入图像生成描述性文本

视觉问答

回答关于图像内容的自然语言问题

内容创作

多模态内容生成

结合图像和文本输入生成相关内容

属性	详情
模型开发者	jarvisvasu
许可证	apache-2.0
微调基础模型	Qwen/Qwen2.5-VL-7B-Instruct
标签	text-generation-inference、transformers、unsloth、qwen2_5_vl、trl

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Qwen2.5 VL 7B Instruct 4bit

模型简介

模型特点

模型能力

使用案例

🚀 已上传模型

🚀 快速开始

模型信息

训练加速说明

相关图片

📄 许可证