ImageNet分类
Pvt Medium 224
Apache-2.0
PVT是一种基于Transformer的视觉模型,采用金字塔结构处理图像,在ImageNet-1K上预训练,适用于图像分类任务。
图像分类
Transformers
P
Xrenya
13
0
Convnextv2 Huge 1k 224
Apache-2.0
ConvNeXt V2是基于FCMAE框架预训练的纯卷积模型,在ImageNet-1K数据集上微调,适用于图像分类任务。
图像分类
Transformers
C
facebook
272
0
Nat Base In1k 224
MIT
NAT-Base是基于ImageNet-1K训练的视觉Transformer模型,采用邻域注意力机制进行图像分类。
图像分类
Transformers
其他
N
shi-labs
6
0
Nat Small In1k 224
MIT
NAT-Small是基于邻域注意力的分层视觉变换器,专为图像分类任务设计
图像分类
Transformers
其他
N
shi-labs
6
0
Cvt 13
Apache-2.0
CvT-13是一种结合卷积神经网络和视觉变换器的混合架构模型,在ImageNet-1k数据集上预训练完成,适用于图像分类任务。
图像分类
Transformers
C
microsoft
21.80k
11
Resnet 50
Apache-2.0
ResNet-50是基于ImageNet-1k预训练的残差网络模型,采用v1.5架构改进,适用于图像分类任务。
图像分类
R
microsoft
273.80k
407
Resnet 18
Apache-2.0
基于ImageNet-1k训练的ResNet模型,采用残差连接结构,支持图像分类任务
图像分类
Transformers
R
microsoft
133.01k
52
Resnet 152
Apache-2.0
基于ImageNet-1k数据集预训练的深度残差网络模型,用于图像分类任务
图像分类
Transformers
R
microsoft
18.22k
12
Regnet X 040
Apache-2.0
基于imagenet-1k训练的RegNet模型,通过神经架构搜索设计的高效视觉模型
图像分类
Transformers
R
facebook
69
1
Regnet X 002
Apache-2.0
基于ImageNet-1k训练的RegNet图像分类模型,通过神经架构搜索设计的高效网络结构
图像分类
Transformers
R
facebook
60
1
Resnet50
基于ImageNet数据集预训练的深度残差网络模型,用于图像分类任务。
图像分类
Transformers
R
leftthomas
18
0
Beit Large Patch16 224
Apache-2.0
BEiT是一种基于视觉Transformer(ViT)架构的图像分类模型,通过自监督学习在ImageNet-21k上预训练,并在ImageNet-1k上微调。
图像分类
B
microsoft
222.46k
1
Vision Perceiver Conv
Apache-2.0
基于ImageNet预训练的通用视觉感知器模型,采用卷积预处理和Transformer架构,支持图像分类任务
图像分类
Transformers
V
deepmind
7,127
6
Beit Base Patch16 384
Apache-2.0
BEiT是一种基于视觉Transformer架构的图像分类模型,通过自监督方式在ImageNet-21k上预训练,并在ImageNet-1k上微调。
图像分类
B
microsoft
146
5
Beit Base Patch16 224
Apache-2.0
BEiT是一种基于视觉Transformer的模型,通过自监督学习在ImageNet-21k上预训练,并在ImageNet-1k上微调,用于图像分类任务。
图像分类
B
microsoft
58.34k
9
Convnext Large 224 22k 1k
Apache-2.0
ConvNeXT是一个纯卷积模型,受视觉Transformer设计启发,在ImageNet-22k上预训练并在ImageNet-1k上微调,性能优于传统视觉Transformer。
图像分类
Transformers
C
facebook
13.71k
3