图像分类骨干
Dinov2 With Registers Small Imagenet1k 1 Layer
Apache-2.0
基于DINOv2训练的视觉Transformer模型,通过添加寄存器令牌改进注意力机制,消除伪影并提升性能
图像分类
Transformers
D
facebook
445
2
Regnety 320.seer
其他
RegNetY-32GF特征提取模型,采用SEER方法在20亿张随机网络图片上预训练,适用于图像分类和特征提取任务
图像分类
Transformers
R
timm
19
0
Convnextv2 Base.fcmae
基于ConvNeXt-V2的自监督特征表示模型,采用全卷积掩码自编码器框架(FCMAE)进行预训练
图像分类
Transformers
C
timm
629
1
Convnextv2 Atto.fcmae
基于ConvNeXt-V2的自监督特征表示模型,采用全卷积掩码自编码器框架(FCMAE)进行预训练,适用于图像分类和特征提取任务。
图像分类
Transformers
C
timm
485
0
Swinv2 Base Patch4 Window12to24 192to384 22kto1k Ft
Apache-2.0
Swin Transformer v2是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像分类和密集识别任务。
图像分类
Transformers
S
microsoft
1,824
0
Swinv2 Base Patch4 Window12 192 22k
Apache-2.0
Swin Transformer v2 是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像处理。
图像分类
Transformers
S
microsoft
8,603
3
Swinv2 Small Patch4 Window16 256
Apache-2.0
Swin Transformer v2 是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像处理。
图像分类
Transformers
S
microsoft
315
1
Swinv2 Tiny Patch4 Window16 256
Apache-2.0
Swin Transformer v2 是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像分类。
图像分类
Transformers
S
microsoft
403.69k
5
Swin Base Patch4 Window7 224
Apache-2.0
Swin Transformer是一种基于移动窗口的分层视觉Transformer,适用于图像分类任务。
图像分类
Transformers
S
microsoft
281.49k
15
Swin Large Patch4 Window7 224
Apache-2.0
Swin Transformer是一种层次化视觉Transformer,通过局部窗口计算自注意力实现线性计算复杂度,适合图像分类和密集识别任务。
图像分类
Transformers
S
microsoft
2,079
1
Swin Base Patch4 Window12 384
Apache-2.0
Swin Transformer是一种基于移位窗口的分层视觉Transformer,专为图像分类任务设计,计算复杂度与输入图像大小呈线性关系。
图像分类
Transformers
S
microsoft
1,421
4
Swin Large Patch4 Window7 224 In22k
Apache-2.0
Swin Transformer是一种基于移动窗口的分层视觉Transformer,在ImageNet-21k数据集上预训练,适用于图像分类任务。
图像分类
Transformers
S
microsoft
387
2
Swin Tiny Patch4 Window7 224
Apache-2.0
Swin Transformer是一种分层视觉Transformer,通过局部窗口计算自注意力实现线性计算复杂度,适合图像分类任务。
图像分类
Transformers
S
microsoft
98.00k
42