高精度图像识别
Vit Base Oxford Iiit Pets
Apache-2.0
基于Google Vision Transformer (ViT)微调的宠物品种分类模型,在Oxford-IIIT宠物数据集上达到94.45%准确率
图像分类
Transformers
V
ISxOdin
78
0
Mobilenet V2 1.0 224 Finetuned Plantdisease
其他
基于MobileNetV2架构的植物病害图像分类模型,在图像分类任务上达到97.77%的准确率
图像分类
Transformers
M
ozair23
461
6
Aimv2 Large Patch14 224 Distilled
AIMv2是通过多模态自回归目标预训练的视觉模型系列,在多模态理解基准测试中表现优异。
图像分类
A
apple
236
0
Accomodation Room Classification
Apache-2.0
基于Google的ViT模型微调,用于住宿房间图像分类,验证集准确率达87.5%
图像分类
Transformers
A
sharmajai901
29
1
Platzi Vit Model Mewita
Apache-2.0
基于Google的ViT模型在豆类数据集上微调的图像分类模型,准确率达97.74%
图像分类
Transformers
P
platzi
15
0
Astrophotography Object Classifier Alpha2
这是一个通过AutoTrain训练的天文摄影物体分类模型,能够准确识别天文摄影中的不同物体类别。
图像分类
Transformers
A
bortle
16
0
Deit Base Patch16 224 Plant Seedling Classification
Apache-2.0
基于平衡数据集训练的植物幼苗分类模型,在测试集上准确率达94.67%
图像分类
Transformers
D
uisikdag
35
0
Convnextv2 Large 22k 224
Apache-2.0
ConvNeXt V2是一种纯卷积模型,通过FCMAE框架预训练并在ImageNet-22K数据集上微调,显著提升了纯卷积网络在识别任务上的性能。
图像分类
Transformers
C
facebook
437
2
Vit Base Patch16 224 In21k Car Or Motorcycle
Apache-2.0
基于ViT架构的二分类模型,用于区分汽车和摩托车图像,准确率达99.38%
图像分类
Transformers
英语
V
DunnBC22
64
2
Vit Base Beans
Apache-2.0
基于Google的ViT模型在豆类数据集上微调的高精度图像分类模型
图像分类
Transformers
V
derhuli
33
0
Resnet152 FV Finetuned Memes
Apache-2.0
基于微软ResNet-152架构微调的表情包分类模型,在图像分类任务上表现良好。
图像分类
Transformers
R
jayanta
26
0
Dog Food Convnext Tiny 224
该模型是基于Dogs vs Food数据集训练的ConvNeXt-Tiny架构图像分类模型,专门用于区分狗和食物的图像。
图像分类
Transformers
D
sasha
14
0
Swin Base Finetuned Snacks
Apache-2.0
基于Swin Transformer架构的零食图像分类模型,在零食数据集上微调后准确率达到94.55%
图像分类
Transformers
S
aspis
15
0
Rock Challenge DeiT Solo
这是一个基于DeiT架构的图像分类模型,专门用于岩石颗粒分类任务。
图像分类
Transformers
R
dimbyTa
30
0
Resnet 152
Apache-2.0
基于ImageNet-1k数据集预训练的深度残差网络模型,用于图像分类任务
图像分类
Transformers
R
microsoft
18.22k
12
Resnet50
基于ImageNet数据集预训练的深度残差网络模型,用于图像分类任务。
图像分类
Transformers
R
leftthomas
18
0