ShareGPT4V-7B开源视觉主干模型 - 免费用于多模态研究与聊天机器人开发

首页

Sharegpt4v 7B Pretrained Vit Large336 L12

由 Lin-Chen 开发

ShareGPT4V-7B是基于高质量图文对数据集微调的视觉主干模型，主要用于多模态研究和聊天机器人开发。

文本生成图像

Transformers

#多模态视觉主干 #高质量图文对训练 #大型LMM研究

下载量 1,666

发布时间 : 11/21/2023

模型简介

这是一个基于ShareGPT4V数据集微调的视觉主干模型，专注于处理图像特征提取任务，支持大型多模态模型的研究与应用。

模型特点

高质量视觉特征提取

基于120万组高质量图文对训练，能够提取丰富的图像特征

多模态研究支持

专为大型多模态模型和聊天机器人研究设计

Llama 2架构基础

基于强大的Llama 2架构构建，具有良好的扩展性

模型能力

图像特征提取

多模态理解

视觉-语言对齐

使用案例

人工智能研究

多模态模型开发

作为视觉主干用于构建大型多模态模型

提升模型对图像内容的理解能力

智能聊天机器人

为聊天机器人提供视觉理解能力

实现图文交互的智能对话

计算机视觉应用

图像内容分析

提取图像特征用于内容理解和分类

提高图像分析的准确性

属性	详情
模型类型	这是基于ShareGPT4V数据集微调的ShareGPT4V - 7B视觉塔模型。
模型日期	该视觉塔于2023年11月完成训练。
更多信息资源	[项目] [论文] [代码]

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Sharegpt4v 7B Pretrained Vit Large336 L12

模型简介

模型特点

模型能力

使用案例

🚀 ShareGPT4V模型介绍

🚀 快速开始

✨ 主要特性

📚 详细文档

模型详情

预期用途

主要预期用途

主要目标用户

训练数据集

📄 许可证