S

Sharegpt4v 7B

由 Lin-Chen 开发
ShareGPT4V-7B 是一个开源的多模态聊天机器人模型,通过基于 GPT4-Vision 辅助的数据和 LLaVA 指令微调数据训练而成。
下载量 530
发布时间 : 11/20/2023
模型介绍
内容详情
替代品

模型简介

该模型结合了 CLP 视觉塔及 LLaMA/Vicuna,专注于研究大型多模态模型及聊天机器人应用。

模型特点

多模态理解
能够同时处理图像和文本输入,理解图文内容
高质量训练数据
使用了120万高质量图文对和10万GPT4-Vision生成的图文对
开源可扩展
完全开源,可在LLaVA代码库中无缝加载

模型能力

图像理解
多模态对话
图文生成
视觉问答

使用案例

研究
多模态模型研究
用于计算机视觉和自然语言处理交叉领域的研究
应用开发
智能聊天机器人
开发能够理解图像内容的对话系统