ImageNet-22k预训练
Eva02 Small Patch14 224.mim In22k
MIT
EVA02特征/表示模型,通过掩码图像建模在ImageNet-22k上预训练,适用于图像分类和特征提取任务。
图像分类
Transformers
E
timm
705
0
Focalnet Huge Fl4.ms In22k
MIT
FocalNet是一个基于焦点调制网络的图像分类模型,由微软团队在ImageNet-22k数据集上预训练完成。
图像分类
Transformers
F
timm
103
0
Cvt 21 384 22k
Apache-2.0
CvT-21是一种结合卷积和Transformer架构的视觉模型,在ImageNet-22k上预训练并在ImageNet-1k上微调
图像分类
Transformers
C
microsoft
134
3
Cvt 13 384 22k
Apache-2.0
CvT-13是一种结合卷积和Transformer的视觉模型,在ImageNet-22k上预训练并在ImageNet-1k上微调,适用于图像分类任务。
图像分类
Transformers
C
microsoft
508
0
Convnext Base 384 22k 1k
Apache-2.0
ConvNeXT是一个纯卷积模型,受视觉Transformer设计启发,在ImageNet-22k上预训练并在ImageNet-1k上微调,性能优于Transformer。
图像分类
Transformers
C
facebook
797
3
Convnext Xlarge 224 22k
Apache-2.0
ConvNeXT是一个纯卷积模型,其设计灵感来自视觉Transformer,宣称性能优于视觉Transformer。
图像分类
Transformers
C
facebook
2,135
1
Convnext Large 224 22k
Apache-2.0
ConvNeXT是一个纯卷积模型,受视觉Transformer设计启发,在ImageNet-22k数据集上训练而成,性能超越Transformer。
图像分类
Transformers
C
facebook
1,425
0
Convnext Large 384 22k 1k
Apache-2.0
ConvNeXT是一个纯卷积模型,受视觉Transformer设计启发,在ImageNet-22k上预训练并在ImageNet-1k上微调,性能优于传统Transformer。
图像分类
Transformers
C
facebook
73
0
Convnext Base 224 22k
Apache-2.0
ConvNeXT是一个纯卷积模型,其设计灵感来自视觉Transformer,宣称性能优于视觉Transformer。
图像分类
Transformers
C
facebook
1,797
6