V

Vit Msn Large

由 facebook 开发
采用MSN方法预训练的视觉Transformer模型,在少样本场景下表现优异
下载量 48
发布时间 : 9/9/2022
模型介绍
内容详情
替代品

模型简介

该视觉Transformer模型通过Masked Siamese Networks方法预训练,特别适合标注数据有限的图像分类任务,能够学习图像的内在表征并迁移到下游任务

模型特点

少样本学习能力
通过MSN预训练方法,在标注数据有限的场景下仍能保持优异性能
联合嵌入架构
采用掩码图块与原型图块匹配的独特训练方式
迁移学习友好
预训练表征可轻松迁移到各种下游视觉任务

模型能力

图像特征提取
少样本图像分类
视觉表征学习

使用案例

计算机视觉
少样本图像分类
在标注样本有限的情况下实现图像分类
在少样本和极少量样本场景下表现卓越
视觉特征提取
作为基础编码器提取图像特征