L

Llava V1.5 7b Lora

由 liuhaotian 开发
LLaVA是一个开源多模态聊天机器人,基于LLaMA/Vicuna模型在GPT生成的多模态指令数据上微调训练而成。
下载量 413
发布时间 : 10/26/2023
模型介绍
内容详情
替代品

模型简介

LLaVA是一个结合视觉和语言理解能力的多模态模型,能够处理图像和文本输入,生成自然语言响应。

模型特点

多模态理解
能够同时处理图像和文本输入,理解两者之间的关系
指令跟随
经过大量指令数据训练,能够准确执行用户指令
开源可访问
采用开源许可证,方便研究和商业应用

模型能力

图像描述生成
视觉问答
多模态对话
图像内容理解
指令跟随

使用案例

研究
多模态模型研究
用于研究大型多模态模型的行为和能力
应用开发
智能聊天机器人
开发能够理解图像内容的智能对话系统