X

Xgen Mm Phi3 Mini Instruct R V1

由 Salesforce 开发
xGen-MM是Salesforce AI Research开发的最新基础大型多模态模型系列,基于BLIP系列改进,具有强大的图像理解和文本生成能力。
下载量 804
发布时间 : 5/6/2024
模型介绍
内容详情
替代品

模型简介

xGen-MM是Salesforce AI Research开发的大型多模态模型系列,支持图像和文本的联合处理,适用于多种视觉语言任务。

模型特点

强大的多模态能力
支持图像和文本的联合处理,具有卓越的图像理解和文本生成能力。
高效的视觉标记采样
支持灵活的高分辨率图像编码,具有高效的视觉标记采样能力。
上下文学习能力
预训练基础模型展现出强大的上下文学习能力。

模型能力

图像描述生成
视觉问答
多模态推理
图像文本联合处理

使用案例

视觉问答
图像内容问答
回答关于图像内容的自然语言问题。
在多个基准测试中表现优异。
图像描述生成
自动图像标注
为图像生成详细的自然语言描述。
在COCO等数据集上表现优异。