llava-v1.5-7b-lora开源多模态聊天机器人 - 免费畅享跨模态智能对话体验

Llava V1.5 7b Lora

由 liuhaotian 开发

LLaVA是一个开源多模态聊天机器人，基于LLaMA/Vicuna模型在GPT生成的多模态指令数据上微调训练而成。

下载量 413

发布时间 : 10/26/2023

模型简介

LLaVA是一个结合视觉和语言理解能力的多模态模型，能够处理图像和文本输入，生成自然语言响应。

多模态理解

能够同时处理图像和文本输入，理解两者之间的关系

指令跟随

经过大量指令数据训练，能够准确执行用户指令

开源可访问

采用开源许可证，方便研究和商业应用

图像描述生成

视觉问答

多模态对话

图像内容理解

指令跟随

研究

多模态模型研究

用于研究大型多模态模型的行为和能力

应用开发

智能聊天机器人

开发能够理解图像内容的智能对话系统

属性	详情
模型类型	LLaVA是一个开源聊天机器人，通过在GPT生成的多模态指令遵循数据上微调LLaMA/Vicuna训练得到。它是一个基于Transformer架构的自回归语言模型。
模型日期	LLaVA-v1.5-7B-LoRA于2023年10月训练。
更多信息的论文或资源	https://llava-vl.github.io/