L

Llava V1.5 13b Lora

由 liuhaotian 开发
LLaVA 是一个开源的多模态聊天机器人,通过对 LLaMA/Vicuna 进行微调,并基于 GPT 生成的多模态指令跟随数据训练而成。
下载量 143
发布时间 : 10/26/2023
模型介绍
内容详情
替代品

模型简介

LLaVA 是一个基于 Transformer 架构的自回归语言模型,主要用于研究大型多模态模型和聊天机器人。

模型特点

多模态能力
结合视觉和语言理解能力,能够处理图像和文本的联合任务
指令跟随
能够理解和执行基于多模态输入的复杂指令
开源模型
基于开源框架开发,可供研究和改进

模型能力

图像理解
多模态对话
视觉问答
图像描述生成
多模态指令理解

使用案例

学术研究
多模态模型研究
用于研究视觉语言联合表示和跨模态理解
聊天机器人开发
作为多模态聊天机器人的基础模型
教育应用
视觉辅助学习
帮助学生通过图像理解复杂概念