U

Unime Phi3.5 V 4.2B

由 DeepGlint-AI 开发
UniME 是一个基于多模态大模型的通用嵌入学习模型,专注于打破模态壁垒,实现跨模态检索和嵌入学习。
下载量 54
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

UniME 使用文本判别性知识蒸馏和硬负样本增强的指令调优方法,增强多模态大模型的嵌入能力,支持图像和文本的跨模态检索。

模型特点

文本判别性知识蒸馏
通过KL散度对齐学生模型和教师模型在批次相似度分布上的嵌入,仅微调语言模型组件,其余参数保持冻结。
硬负样本增强的指令调优
使用相似度阈值的假负样本过滤机制和自动硬负样本采样策略,提升视觉敏感性、加强跨模态对齐和增强指令跟随能力。
高分辨率图像处理
支持336×336图像分辨率训练,在多模态嵌入基准测试中表现优异。

模型能力

图像嵌入
文本嵌入
跨模态检索
多模态对齐

使用案例

跨模态检索
图像到文本检索
根据图像内容检索相关的文本描述。
在MMEB排行榜上位列第一。
文本到图像检索
根据文本描述检索相关的图像。
在多样化检索任务中表现优异。