V

Vit Msn Large 7

由 facebook 开发
该视觉Transformer模型采用MSN方法预训练,在少样本场景下表现出色,适用于图像分类等任务
下载量 67
发布时间 : 9/9/2022

模型简介

基于掩码孪生网络(MSN)预训练的视觉Transformer模型,通过匹配掩码与未掩码图像块的原型学习图像表征,特别适合标注数据有限的场景

模型特点

少样本学习能力
采用MSN预训练方法,在标注数据有限的情况下仍能保持优异性能
联合嵌入架构
通过匹配掩码块与未掩码块的原型学习图像表征
大规模预训练
基于ImageNet-1k数据集进行预训练,学习通用视觉特征

模型能力

图像特征提取
图像分类
少样本学习

使用案例

计算机视觉
图像分类
在标注数据有限的情况下进行图像分类任务
在少样本和极少量样本场景下表现卓越
特征提取
作为骨干网络提取图像特征用于下游任务
AIbase
智启未来,您的人工智能解决方案智库
简体中文