L

Llama 3.2 Vision Instruct Bpmncoder

由 utkarshkingh 开发
基于Unsloth优化的Llama 3.2 11B视觉指令微调模型,采用4位量化技术,训练速度提升2倍
下载量 40
发布时间 : 3/23/2025
模型介绍
内容详情
替代品

模型简介

这是一个经过微调的多模态语言模型,支持视觉和文本指令理解与生成,适用于多模态交互场景

模型特点

高效训练优化
使用Unsloth框架优化,训练速度提升2倍
4位量化技术
采用BNB 4位量化,降低显存需求
多模态支持
支持视觉和文本指令的理解与生成

模型能力

多模态指令理解
文本生成
视觉内容分析
推理任务处理

使用案例

智能助手
多模态对话系统
处理包含图像和文本的复杂用户查询
提供结合视觉和文本信息的综合回答
内容生成
图文内容创作
根据视觉输入生成相关文本描述
自动生成高质量的图文匹配内容