L

Llava V1.5 7b Gguf

由 granddad 开发
LLaVA 是一个开源多模态聊天机器人,通过对 LLaMA/Vicuna 进行微调,基于 GPT 生成的多模态指令跟随数据训练而成。
下载量 13
发布时间 : 2/15/2024
模型介绍
内容详情
替代品

模型简介

LLaVA 是一款基于 Transformer 架构的自回归语言模型,主要用于研究大型多模态模型和聊天机器人。

模型特点

多模态能力
能够同时处理图像和文本输入,实现跨模态交互
指令跟随
经过专门训练以理解和执行复杂的多模态指令
开源模型
基于开源基础模型 LLaMA/Vicuna 构建

模型能力

图像描述生成
视觉问答
多模态对话
指令跟随

使用案例

学术研究
多模态模型研究
用于研究视觉语言模型的性能和能力
人机交互研究
探索基于多模态的聊天机器人交互方式
教育
视觉辅助学习
帮助学生通过图像和文本结合的方式理解概念