llava-v1.6-vicuna-7b开源多模态聊天机器人 - 免费使用实现跨模态交流

Llava V1.6 Vicuna 7b

由 liuhaotian 开发

LLaVA是一款开源的多模态聊天机器人，通过对多模态指令跟随数据进行大语言模型微调训练而成。

下载量 31.65k

发布时间 : 1/31/2024

模型简介

LLaVA主要用于大型多模态模型及聊天机器人的学术研究，支持图像与文本的多模态交互。

多模态能力

支持图像与文本的联合理解与生成，能够处理复杂的多模态指令。

开源模型

完全开源，便于研究人员进行二次开发和学术研究。

大规模训练数据

使用了超过1.2M的多模态训练数据，包括图像-文本对和指令跟随数据。

图像理解

多模态对话

视觉问答

指令跟随

文本生成

学术研究

多模态模型研究

用于研究视觉语言模型的性能和能力边界。

人机交互实验

作为基础模型用于开发更智能的聊天机器人。

教育

视觉辅助学习

帮助学生通过图像和文本的交互方式学习复杂概念。

LLaVA是一个开源聊天机器人模型，通过在多模态指令跟随数据上微调大语言模型（LLM）训练得到。它能助力多模态大模型和聊天机器人的研究。

LLaVA可用于多模态大模型和聊天机器人的研究工作。如果你是计算机视觉、自然语言处理、机器学习和人工智能领域的研究人员或爱好者，可借助该模型开展相关研究。

LLaVA是基于Transformer架构的自回归语言模型，以[lmsys/vicuna - 7b - v1.5](https://huggingface.co/lmsys/vicuna - 7b - v1.5)作为基础大语言模型进行微调训练。

属性	详情
模型类型	LLaVA是一个开源聊天机器人，通过在多模态指令跟随数据上微调大语言模型（LLM）训练得到。它是基于Transformer架构的自回归语言模型，基础大语言模型为[lmsys/vicuna - 7b - v1.5](https://huggingface.co/lmsys/vicuna - 7b - v1.5)。
模型日期	LLaVA - v1.6 - Vicuna - 7B于2023年12月训练。
更多信息的论文或资源	https://llava - vl.github.io/