L

Llava Llama 2 7b Chat Lightning Lora Preview

由 liuhaotian 开发
LLaVA是一款开源多模态聊天机器人,基于LLaMA/Vicuna微调,通过GPT生成的多模态指令跟随数据训练而成。
下载量 251
发布时间 : 7/19/2023
模型介绍
内容详情
替代品

模型简介

LLaVA是一个结合视觉和语言理解的多模态模型,主要用于研究大型多模态模型及聊天机器人开发。

模型特点

多模态能力
同时处理图像和文本输入,实现跨模态理解
指令跟随
能够理解和执行复杂的多模态指令
开源模型
完全开源,可供研究和商业使用

模型能力

图像描述生成
视觉问答
多模态对话
复杂推理
细节描述

使用案例

研究
多模态模型研究
用于研究视觉语言模型的性能和能力边界
在ScienceQA数据集上创造了最新最优性能
应用开发
智能聊天机器人
开发能理解图像内容的对话系统