L

Llava V1.6 Mistral 7b

由 liuhaotian 开发
LLaVA 是一个开源的多模态聊天机器人,通过在多模态指令跟随数据上微调大语言模型训练而成。
下载量 27.45k
发布时间 : 1/31/2024
模型介绍
内容详情
替代品

模型简介

LLaVA 是基于 transformer 架构的自回归语言模型,能够处理图像和文本输入,生成文本输出。

模型特点

多模态能力
能够同时处理图像和文本输入,生成相关的文本输出
指令跟随
经过多模态指令跟随数据的专门训练,能够理解并执行复杂指令
开源模型
完全开源,允许研究者和开发者自由使用和修改

模型能力

图像理解
多模态对话
视觉问答
指令跟随
文本生成

使用案例

研究
多模态模型研究
用于研究大型多模态模型的行为和能力
教育
视觉辅助学习
帮助学生通过图像和文本交互方式学习知识