X

Xgen Mm Phi3 Mini Instruct Dpo R V1.5

由 Salesforce 开发
xGen-MM是Salesforce AI Research开发的多模态基础模型系列,基于BLIP系列改进,在高质量图像字幕和交错图文数据上训练。
下载量 305
发布时间 : 8/9/2024
模型介绍
内容详情
替代品

模型简介

该模型是xGen-MM系列的DPO(Direct Preference Optimization)版本,专注于提升多模态理解能力和安全性,适用于图像文本生成和交互任务。

模型特点

多模态理解
在单图像和多图像基准测试中表现优异,支持复杂的多模态交互任务。
安全优化
通过DPO训练显著降低有害内容生成概率(VLGuard得分5.2,优于基准模型)。
综合性能
在POPE、MMBench、SEED-IMG等多个基准测试中超越同类模型。

模型能力

图像描述生成
多图像推理
安全内容过滤
视觉问答
跨模态理解

使用案例

内容审核
有害内容检测
自动识别图像和文本中的潜在有害内容
VLGuard得分5.2(越低越好)
教育
多模态学习助手
解析教材中的图文内容并生成解释
MMBench开发集得分76.4