L

Llava V1.5 13B AWQ

由 TheBloke 开发
LLaVA是一个开源的多模态聊天机器人,通过微调LLaMA/Vicuna在GPT生成的多模态指令跟随数据上进行训练。
下载量 141
发布时间 : 10/15/2023
模型介绍
内容详情
替代品

模型简介

LLaVA是一个基于transformer架构的自回归语言模型,能够理解和生成与图像相关的文本内容。

模型特点

多模态理解
能够同时处理图像和文本输入,理解两者之间的关系
指令跟随
可以遵循复杂的多模态指令执行任务
开源
模型完全开源,可供研究和商业使用

模型能力

视觉问答
图像描述生成
多模态对话
指令跟随

使用案例

研究
多模态模型研究
用于研究大型多模态模型的行为和能力
教育
视觉辅助学习
帮助学生通过图像理解复杂概念