llava - v1.6 - 34b开源多模态聊天机器人 - 免费实现图像与文本交互聊天

Llava V1.6 34b

由 liuhaotian 开发

LLaVA是一个开源的多模态聊天机器人，基于大语言模型微调训练而成，支持图像和文本的交互。

下载量 9,033

发布时间 : 1/31/2024

模型简介

LLaVA是一个基于Transformer架构的自回归语言模型，通过对多模态指令跟随数据进行微调训练而成，主要用于大型多模态模型和聊天机器人的学术研究。

多模态支持

支持图像和文本的交互，能够理解和生成基于图像内容的文本响应。

开源

模型完全开源，便于研究和定制。

指令跟随

通过多模态指令跟随数据进行微调，能够更好地理解和执行复杂指令。

图像描述生成

多模态对话

视觉问答

指令跟随

学术研究

多模态模型研究

用于研究多模态模型的性能和能力。

聊天机器人开发

作为基础模型用于开发多模态聊天机器人。

教育

视觉问答系统

用于教育场景中的视觉问答系统，帮助学生理解图像内容。

属性	详情
模型类型	LLaVA是一个开源聊天机器人，通过在多模态指令跟随数据上微调大语言模型（LLM）进行训练。它是基于Transformer架构的自回归语言模型。基础大语言模型：NousResearch/Nous-Hermes-2-Yi-34B
模型日期	LLaVA-v1.6-34B于2023年12月训练。
更多信息的论文或资源	https://llava-vl.github.io/