F

Fare4 Clip

由 chs20 开发
基于OpenAI CLIP初始化的视觉语言模型,通过无监督对抗微调提升鲁棒性
下载量 45
发布时间 : 2/23/2024
模型介绍
内容详情
替代品

模型简介

该模型是基于CLIP架构的视觉语言模型,经过在ImageNet数据集上采用无穷范数和4/255半径的无监督对抗微调,增强了模型的鲁棒性。

模型特点

无监督对抗微调
在ImageNet上采用无穷范数和4/255半径进行对抗训练,提升模型鲁棒性
基于CLIP架构
继承CLIP强大的视觉语言对齐能力
鲁棒性增强
专门针对对抗攻击场景优化,提高模型稳定性

模型能力

零样本图像分类
图像-文本匹配
跨模态检索

使用案例

计算机视觉
鲁棒图像分类
在对抗攻击环境下进行可靠的图像分类
相比标准CLIP模型具有更强的对抗鲁棒性
跨模态检索
在对抗条件下实现图像与文本的相互检索