V

Vit Msn Base 4

由 facebook 开发
该视觉Transformer模型采用MSN方法预训练,在少样本场景下表现优异,适用于图像分类等任务
下载量 62
发布时间 : 9/9/2022
模型介绍
内容详情
替代品

模型简介

基于MSN(Masked Siamese Networks)方法预训练的视觉Transformer模型,通过掩码块与原型匹配学习图像表示,特别适合标注数据有限的下游任务

模型特点

少样本学习优势
采用MSN预训练方法,在标注数据有限的场景下仍能保持优异性能
联合嵌入架构
通过掩码块与未掩码原型的匹配学习图像表示
分块处理
将图像分割为4x4的块序列进行处理,适合处理局部图像特征

模型能力

图像特征提取
图像分类
少样本学习

使用案例

计算机视觉
图像分类
在有限标注数据下实现高精度图像分类
在少样本和极低样本场景下表现优异
特征提取
提取图像特征用于下游任务