ShareGPT4V-7B开源多模态聊天机器人 - 免费使用开启跨模态交流新体验

Sharegpt4v 7B

由 Lin-Chen 开发

ShareGPT4V-7B 是一个开源的多模态聊天机器人模型，通过基于 GPT4-Vision 辅助的数据和 LLaVA 指令微调数据训练而成。

下载量 530

发布时间 : 11/20/2023

模型简介

该模型结合了 CLP 视觉塔及 LLaMA/Vicuna，专注于研究大型多模态模型及聊天机器人应用。

多模态理解

能够同时处理图像和文本输入，理解图文内容

高质量训练数据

使用了120万高质量图文对和10万GPT4-Vision生成的图文对

开源可扩展

完全开源，可在LLaVA代码库中无缝加载

图像理解

多模态对话

图文生成

视觉问答

研究

多模态模型研究

用于计算机视觉和自然语言处理交叉领域的研究

应用开发

智能聊天机器人

开发能够理解图像内容的对话系统

属性	详情
模型类型	ShareGPT4V-7B是一个开源聊天机器人，通过在GPT4-Vision辅助的ShareGPT4V数据和LLaVA指令调优数据上微调CLP视觉塔和LLaMA/Vicuna进行训练。
模型日期	ShareGPT4V-7B于2023年11月进行训练。
更多信息的论文或资源	[项目] [论文] [代码]