分层视觉Transformer
Hiera Huge 224 Hf
Hiera是一种高效的分层视觉Transformer模型,在图像和视频任务中表现优异且运行速度快
图像分类
Transformers
英语
H
facebook
41
1
Upernet Swin Large
MIT
UperNet是一种用于语义分割的框架,结合Swin Transformer骨干网络实现像素级场景理解
图像分割
Transformers
英语
U
openmmlab
3,251
0
Dinat Mini In1k 224
MIT
DiNAT-Mini是基于邻域注意力机制的分层视觉Transformer模型,专为图像分类任务设计。
图像分类
Transformers
D
shi-labs
462
1
Swinv2 Large Patch4 Window12to24 192to384 22kto1k Ft
Apache-2.0
Swin Transformer v2是基于ImageNet-21k预训练并在384x384分辨率下对ImageNet-1k进行微调的视觉Transformer模型,具有分层特征图和局部窗口自注意力机制。
图像分类
Transformers
S
microsoft
3,048
4
Swinv2 Large Patch4 Window12to16 192to256 22kto1k Ft
Apache-2.0
Swin Transformer v2是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像分类和密集识别任务。
图像分类
Transformers
S
microsoft
812
4
Swinv2 Base Patch4 Window12to24 192to384 22kto1k Ft
Apache-2.0
Swin Transformer v2是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像分类和密集识别任务。
图像分类
Transformers
S
microsoft
1,824
0
Swinv2 Base Patch4 Window12to16 192to256 22kto1k Ft
Apache-2.0
Swin Transformer v2是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像分类。
图像分类
Transformers
S
microsoft
459
1
Swinv2 Base Patch4 Window12 192 22k
Apache-2.0
Swin Transformer v2 是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像处理。
图像分类
Transformers
S
microsoft
8,603
3
Swinv2 Base Patch4 Window16 256
Apache-2.0
Swin Transformer v2是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像分类和密集识别任务。
图像分类
Transformers
S
microsoft
1,853
3
Swinv2 Base Patch4 Window8 256
Apache-2.0
Swin Transformer v2是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像分类和密集识别任务。
图像分类
Transformers
S
microsoft
16.61k
7
Swinv2 Small Patch4 Window16 256
Apache-2.0
Swin Transformer v2 是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像处理。
图像分类
Transformers
S
microsoft
315
1
Swinv2 Tiny Patch4 Window16 256
Apache-2.0
Swin Transformer v2 是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像分类。
图像分类
Transformers
S
microsoft
403.69k
5
Swinv2 Tiny Patch4 Window8 256
Apache-2.0
Swin Transformer v2是基于ImageNet-1k预训练的视觉Transformer模型,采用分层特征图和局部窗口自注意力机制,具有线性计算复杂度。
图像分类
Transformers
S
microsoft
25.04k
10
Swin Base Patch4 Window7 224
Apache-2.0
Swin Transformer是一种基于移动窗口的分层视觉Transformer,适用于图像分类任务。
图像分类
Transformers
S
microsoft
281.49k
15
Swin Large Patch4 Window7 224
Apache-2.0
Swin Transformer是一种层次化视觉Transformer,通过局部窗口计算自注意力实现线性计算复杂度,适合图像分类和密集识别任务。
图像分类
Transformers
S
microsoft
2,079
1
Swin Large Patch4 Window12 384
Apache-2.0
Swin Transformer是一种基于移位窗口的分层视觉Transformer模型,专为图像分类任务设计。
图像分类
Transformers
S
microsoft
22.77k
1
Swin Base Patch4 Window12 384
Apache-2.0
Swin Transformer是一种基于移位窗口的分层视觉Transformer,专为图像分类任务设计,计算复杂度与输入图像大小呈线性关系。
图像分类
Transformers
S
microsoft
1,421
4
Swin Small Patch4 Window7 224
Apache-2.0
Swin Transformer是一种基于分层窗口的视觉Transformer模型,专为图像分类任务设计,计算复杂度与输入图像大小呈线性关系。
图像分类
Transformers
S
microsoft
2,028
1
Swin Base Patch4 Window7 224 In22k
Apache-2.0
Swin Transformer是一种基于分层窗口计算的视觉Transformer模型,在ImageNet-21k数据集上预训练,适用于图像分类任务。
图像分类
Transformers
S
microsoft
13.30k
15
Swin Large Patch4 Window12 384 In22k
Apache-2.0
Swin Transformer是一种基于分层窗口的视觉Transformer模型,在ImageNet-21k数据集上预训练,适用于图像分类任务。
图像分类
Transformers
S
microsoft
1,063
7
Swin Tiny Patch4 Window7 224
Apache-2.0
Swin Transformer是一种分层视觉Transformer,通过局部窗口计算自注意力实现线性计算复杂度,适合图像分类任务。
图像分类
Transformers
S
microsoft
98.00k
42
Swin Large Patch4 Window7 224 In22k
Apache-2.0
Swin Transformer是一种基于移动窗口的分层视觉Transformer,在ImageNet-21k数据集上预训练,适用于图像分类任务。
图像分类
Transformers
S
microsoft
387
2
Swin Base Patch4 Window12 384 In22k
Apache-2.0
Swin Transformer是一种基于移位窗口的分层视觉Transformer模型,专为图像分类任务设计。
图像分类
Transformers
S
microsoft
2,431
1