L

Llama 3.2 90B Vision Instruct Unsloth Bnb 4bit

由 unsloth 开发
Meta Llama 3.2系列90B参数的多模态大语言模型,支持视觉指令理解,经Unsloth动态4位量化优化
下载量 58
发布时间 : 12/4/2024

模型简介

基于Meta Llama 3.2架构的多模态大语言模型,支持视觉和文本输入,专为多语言对话场景优化,适用于代理检索和摘要等任务。Unsloth版本通过动态4位量化技术显著提升推理效率。

模型特点

动态4位量化
采用Unsloth专利技术选择性避免量化关键参数,在保持低显存占用的同时显著提升模型精度
多模态支持
同时处理视觉和文本输入,实现跨模态理解与生成
高效微调
Unsloth优化实现5倍训练速度提升和70%内存节省,支持在消费级GPU上微调
多语言优化
专门针对8种核心语言优化对话能力,支持更广泛的语言扩展

模型能力

视觉问答
多语言文本生成
图像描述生成
跨模态检索
多轮对话
文本摘要

使用案例

智能助手
多模态客服机器人
通过图像和文字理解用户问题,提供精准解答
支持同时处理产品图片和文字描述的复杂查询
内容生成
图文内容创作
根据视觉输入生成营销文案或社交媒体内容
可保持品牌语调一致性的高质量输出
教育
交互式学习助手
解析教材图表并生成解释性内容
提升STEM学科的学习效率
AIbase
智启未来,您的人工智能解决方案智库
简体中文