开源多模态聊天机器人llava-v1.5-7b-gguf - 支持多模态交互免费部署

Llava V1.5 7b Gguf

由 granddad 开发

LLaVA 是一个开源多模态聊天机器人，通过对 LLaMA/Vicuna 进行微调，基于 GPT 生成的多模态指令跟随数据训练而成。

下载量 13

发布时间 : 2/15/2024

模型简介

LLaVA 是一款基于 Transformer 架构的自回归语言模型，主要用于研究大型多模态模型和聊天机器人。

多模态能力

能够同时处理图像和文本输入，实现跨模态交互

指令跟随

经过专门训练以理解和执行复杂的多模态指令

开源模型

基于开源基础模型 LLaMA/Vicuna 构建

图像描述生成

视觉问答

多模态对话

指令跟随

学术研究

多模态模型研究

用于研究视觉语言模型的性能和能力

人机交互研究

探索基于多模态的聊天机器人交互方式

教育

视觉辅助学习

帮助学生通过图像和文本结合的方式理解概念

属性	详情
模型类型	LLaVA是一个开源的聊天机器人，通过在GPT生成的多模态指令跟随数据上微调LLaMA/Vicuna训练得到，是基于Transformer架构的自回归语言模型。
模型日期	LLaVA - v1.5 - 7B于2023年9月训练。
更多信息的论文或资源	https://llava-vl.github.io/