L

Llava V1.5 Mlp2x 336px Pretrain Vicuna 7b V1.5

由 liuhaotian 开发
LLaVA 是一个开源多模态聊天机器人,基于 LLaMA/Vicuna 进行微调,通过 GPT 生成的多模态指令跟随数据训练而成。
下载量 173
发布时间 : 10/5/2023
模型介绍
内容详情
替代品

模型简介

LLaVA 是一个基于 Transformer 架构的自回归语言模型,主要用于大型多模态模型和聊天机器人的研究。

模型特点

多模态能力
结合视觉和语言理解能力,能够处理图像和文本输入。
指令跟随
能够理解和执行复杂的多模态指令。
开源
模型完全开源,可用于研究和开发。

模型能力

图像理解
视觉问答
多模态对话
指令跟随

使用案例

研究
多模态模型研究
用于计算机视觉和自然语言处理交叉领域的研究。
应用开发
智能聊天机器人
开发能够理解图像内容的智能对话系统。