L

Llava V1.6 34b

由 liuhaotian 开发
LLaVA是一个开源的多模态聊天机器人,基于大语言模型微调训练而成,支持图像和文本的交互。
下载量 9,033
发布时间 : 1/31/2024
模型介绍
内容详情
替代品

模型简介

LLaVA是一个基于Transformer架构的自回归语言模型,通过对多模态指令跟随数据进行微调训练而成,主要用于大型多模态模型和聊天机器人的学术研究。

模型特点

多模态支持
支持图像和文本的交互,能够理解和生成基于图像内容的文本响应。
开源
模型完全开源,便于研究和定制。
指令跟随
通过多模态指令跟随数据进行微调,能够更好地理解和执行复杂指令。

模型能力

图像描述生成
多模态对话
视觉问答
指令跟随

使用案例

学术研究
多模态模型研究
用于研究多模态模型的性能和能力。
聊天机器人开发
作为基础模型用于开发多模态聊天机器人。
教育
视觉问答系统
用于教育场景中的视觉问答系统,帮助学生理解图像内容。