LLaVA开源多模态聊天机器人 - 免费使用，支持多种类型对话交流！

Llava V1.5 Mlp2x 336px Pretrain Vicuna 7b V1.5

由 liuhaotian 开发

LLaVA 是一个开源多模态聊天机器人，基于 LLaMA/Vicuna 进行微调，通过 GPT 生成的多模态指令跟随数据训练而成。

下载量 173

发布时间 : 10/5/2023

模型简介

LLaVA 是一个基于 Transformer 架构的自回归语言模型，主要用于大型多模态模型和聊天机器人的研究。

多模态能力

结合视觉和语言理解能力，能够处理图像和文本输入。

指令跟随

能够理解和执行复杂的多模态指令。

开源

模型完全开源，可用于研究和开发。

图像理解

视觉问答

多模态对话

指令跟随

研究

多模态模型研究

用于计算机视觉和自然语言处理交叉领域的研究。

应用开发

智能聊天机器人

开发能够理解图像内容的智能对话系统。

属性	详情
模型类型	LLaVA是一个开源聊天机器人，通过在GPT生成的多模态指令跟随数据上微调LLaMA/Vicuna而得。它是基于Transformer架构的自回归语言模型。
模型日期	LLaVA - v1.5 - MLP2x - 336px - Pretrain - Vicuna - 7B - v1.5于2023年9月完成训练。
更多信息的论文或资源	https://llava-vl.github.io/