V

Vit Msn Small

由 facebook 开发
该视觉Transformer模型采用MSN方法进行预训练,适用于少样本学习场景,特别适合图像分类任务。
下载量 3,755
发布时间 : 9/9/2022
模型介绍
内容详情
替代品

模型简介

该模型是一种基于Transformer架构的视觉模型,通过MSN(Masked Siamese Networks)方法进行预训练,能够有效学习图像的内在表征,适用于少样本和极少量样本场景下的图像分类等任务。

模型特点

少样本学习
通过MSN预训练方法,模型在少样本和极少量样本场景下表现出卓越性能。
联合嵌入架构
采用掩码图块的原型与未掩码图块进行匹配的联合嵌入架构,有效学习图像表征。
预训练优势
预训练后的模型可以提取适用于下游任务的特征,如添加线性层进行图像分类。

模型能力

图像分类
特征提取

使用案例

计算机视觉
少样本图像分类
在标注样本较少的图像分类任务中,使用该模型进行高效训练和预测。
在少样本场景下表现出卓越性能。
图像特征提取
使用该模型提取图像特征,用于后续的机器学习任务。