X

Xgen Mm Phi3 Mini Base R V1

由 Salesforce 开发
XGen-MM是Salesforce AI Research开发的最新多模态大模型系列,基于BLIP的成功设计,通过基础性增强实现了更强大、更优越的模型架构。
下载量 240
发布时间 : 5/7/2024
模型介绍
内容详情
替代品

模型简介

该模型在大规模高质量图像描述数据集和交错图文数据上进行了训练,支持图像文本到文本的任务,具有强大的上下文学习能力。

模型特点

强大的预训练基础模型
在5B参数规模下达到最先进性能,并展现出强大的上下文学习能力。
灵活的指令微调
指令微调模型在5B参数规模的开源/闭源视觉语言模型中表现最佳。
高分辨率图像编码
支持灵活的高分辨率图像编码与高效视觉标记采样。

模型能力

图像描述生成
视觉问答
多模态上下文学习
高分辨率图像处理

使用案例

图像理解与描述
图像内容描述
生成对图像内容的详细描述
示例输出:狗正坐在海滩上向主人挥手。
视觉问答
基于图像的问答
回答关于图像内容的自然语言问题
在OKVQA和TextVQA等基准测试中表现优异