F

FARE4 ViT B 16 Laion2b S34b B88k

由 chs20 开发
基于CLIP模型的鲁棒感知度量模型,通过对抗性微调提升在感知相似性任务中的性能。
下载量 23
发布时间 : 8/14/2024
模型介绍
内容详情
替代品

模型简介

该模型是基于CLIP架构的视觉语言模型,经过对抗性微调(FARE方法),在保持干净数据性能的同时,显著提升了对抗性攻击下的鲁棒性。主要用于零样本图像分类和感知相似性任务。

模型特点

对抗性鲁棒性
使用FARE方法在ImageNet上以无穷范数和半径4/255进行对抗性微调,显著提升模型对对抗性攻击的抵抗力。
高性能感知度量
在NIGHTS感知相似性任务上表现出色,干净数据准确率达90.6%,对抗性攻击下仍保持较高性能。
基于CLIP架构
建立在成熟的CLIP-ViT-B-16架构上,继承了CLIP模型的强大视觉语言对齐能力。

模型能力

零样本图像分类
感知相似性度量
对抗性鲁棒图像分析

使用案例

计算机视觉
图像相似性评估
用于评估两幅图像在人类感知层面的相似程度
在NIGHTS数据集上达到90.6%的准确率
鲁棒图像分类
在存在对抗性干扰的情况下仍能保持较好的分类性能
在L-无穷攻击(eps=4/255)下保持71.5%的准确率
安全关键应用
对抗性攻击检测
识别可能被对抗性攻击篡改的图像内容