llama_3.2-vision_instruct_bpmncoder开源模型 - 免费部署，实现视觉指令高效处理与快速训练

Llama 3.2 Vision Instruct Bpmncoder

由 utkarshkingh 开发

基于Unsloth优化的Llama 3.2 11B视觉指令微调模型，采用4位量化技术，训练速度提升2倍

下载量 40

发布时间 : 3/23/2025

模型简介

这是一个经过微调的多模态语言模型，支持视觉和文本指令理解与生成，适用于多模态交互场景

高效训练优化

使用Unsloth框架优化，训练速度提升2倍

4位量化技术

采用BNB 4位量化，降低显存需求

多模态支持

支持视觉和文本指令的理解与生成

多模态指令理解

文本生成

视觉内容分析

推理任务处理

智能助手

多模态对话系统

处理包含图像和文本的复杂用户查询

提供结合视觉和文本信息的综合回答

内容生成

图文内容创作

根据视觉输入生成相关文本描述

自动生成高质量的图文匹配内容

属性	详情
基础模型	unsloth/llama-3.2-11b-vision-instruct-unsloth-bnb-4bit
标签	text-generation-inference、transformers、unsloth、mllama
开发者	utkarshkingh
许可证	apache-2.0
微调来源模型	unsloth/llama-3.2-11b-vision-instruct-unsloth-bnb-4bit