图像分类
Medai Resnet50 Brain
MIT
ResNet-50 是一个深度残差网络,由微软研究院开发,广泛用于图像分类任务。
图像分类
M
aryan-anand
31
1
Cat Dog Root Me
一个基于PyTorch和HuggingPics构建的图像分类模型,能够准确区分猫和狗的图片。
图像分类
TensorBoard
C
danihdms
21
1
Light Gender Classifier
一个基于HuggingPics生成的轻量级图像分类模型,用于性别分类任务。
图像分类
TensorBoard
L
musaoc
21
1
Plant Identification Vit
Apache-2.0
基于Google Vision Transformer (ViT)架构微调的植物识别模型,在评估集上达到80.96%的准确率
图像分类
Transformers
P
marwaALzaabi
37
1
Utkface Race Classifications
Apache-2.0
该模型是基于microsoft/resnet-50在未知数据集上微调的版本,主要用于图像分类任务,在评估集上取得了84.86%的准确率。
图像分类
Transformers
U
raffaelsiregar
202
1
Kat Tiny Patch16 224.vitft
Apache-2.0
KAT是一种采用分组有理科尔莫戈罗夫-阿诺德网络(GR-KAN)替代传统Transformer中通道混合器的新型视觉模型,在ImageNet-1k数据集上训练。
图像分类
K
adamdad
293
1
Negclip
MIT
开放剪辑是一个零样本图像分类模型,能够在不进行微调的情况下对图像进行分类。
图像分类
N
Nano1337
92
0
UL Exterior Classification
Apache-2.0
基于Google的ViT-base-patch16-224模型微调而成的图像分类模型,在评估集上准确率为68.97%
图像分类
Transformers
U
sharmajai901
319
1
Plant Disease Detection Project
其他
MobileNet V2是一种轻量级的卷积神经网络,专为移动设备设计,在延迟、模型大小和准确性之间取得平衡。
图像分类
Transformers
P
Diginsa
242.43k
4
Font Identifier
Apache-2.0
基于ResNet-18微调的字体识别模型,在测试集上准确率达78.1%
图像分类
Transformers
F
ariadnak
44
2
Font Identifier
MIT
基于ResNet18微调的字体识别模型,可识别48种标准字体,测试准确率达96.33%
图像分类
Transformers
英语
F
gaborcselle
1,292
17
Vit Base Patch16 224 In21k Face Recognition
Apache-2.0
本模型是基于Google的ViT架构在图像文件夹数据集上微调的人脸识别模型,在评估集上取得了接近完美的准确率。
人脸相关
Transformers
V
jayanta
216
12
Birds Classifier EfficientNetB2
Apache-2.0
基于EfficientNet-B2微调的鸟类图像分类器,可识别525种鸟类,准确率高达99%
图像分类
Transformers
B
dennisjooo
4,320
20
Resnet18 Catdog Classifier
Apache-2.0
基于ResNet-18微调的猫狗图像分类模型,在Kaggle猫狗数据集上训练,准确率达99.29%
图像分类
Transformers
英语
R
hilmansw
216
1
Dinov2 Small Imagenet1k 1 Layer
Apache-2.0
基于DINOv2方法训练的小型视觉Transformer模型,适用于图像特征提取和分类任务
图像分类
Transformers
D
facebook
50.86k
2
Organoids Prova Organoid
Apache-2.0
该模型是基于Google的ViT-base-patch16-224在图像文件夹数据集上微调的图像分类模型,在评估集上取得了85.76%的准确率。
图像分类
Transformers
O
gcicceri
25
1
Cola001
基于HuggingPics生成的图像分类模型,能够识别不同品种的狗
图像分类
Transformers
C
GiaKhanh
29
0
Pvt Tiny 224
Apache-2.0
金字塔视觉变换器(PVT)是一种基于变换器架构的视觉模型,专为图像分类任务设计。
图像分类
Transformers
P
Xrenya
25
0
Fun
Apache-2.0
基于google/vit-base-patch16-224微调的视觉模型,适用于图像分类任务
图像分类
Transformers
F
tcvrishank
16
0
Vit Bach Demo
Apache-2.0
基于google/vit-base-patch16-224微调的视觉Transformer模型,适用于图像分类任务
图像分类
Transformers
V
tcvrishank
16
0
Vit Base Letter
Apache-2.0
基于Google的ViT基础模型在字母识别数据集上微调的图像分类模型,准确率达98.81%
图像分类
Transformers
英语
V
pittawat
93
2
Vit Diatome
Apache-2.0
基于Google的ViT模型在Diatome数据集上微调的视觉分类模型,准确率达94.29%
图像分类
Transformers
V
sgonzalezsilot
38
1
Vit Base Aiornot
Apache-2.0
基于google/vit-base-patch16-224微调的视觉模型,具体用途未明确说明
图像分类
Transformers
V
ThankGod
39
0
Face Discriminator
Apache-2.0
基于微软ResNet-50微调的人脸分类模型,在验证集上达到99.84%的准确率
图像分类
Transformers
F
petrznel
23
0
Microsoft Swin Tiny Patch4 Window7 224 Ov
这是由microsoft/swin-tiny-patch4-window7-224模型转换而来的OpenVINO版本,用于加速图像分类推理。
图像分类
Transformers
英语
M
helenai
508
1
Doge
Doge 是一个基于 HuggingPics 生成的图像分类模型,专门用于识别 Doge 相关的图像。
图像分类
Transformers
D
Johnnyboiiii
16
0
Swin Tiny Patch4 Window7 224 Isl Finetuned
Apache-2.0
基于microsoft/swin-tiny-patch4-window7-224微调的视觉模型,在评估集上达到100%准确率
图像分类
Transformers
S
hazardous
17
0
Fl Image Category Multi Label
Apache-2.0
这是一个基于Google的ViT模型进行微调的图像分类模型,在fl_image_category_ds数据集上训练,准确率达到66.22%。
图像分类
Transformers
F
StephenSKelley
17
1
Vit Artworkclassifier
Apache-2.0
基于ViT架构的艺术风格分类模型,可识别输入图像的艺术风格类别
图像分类
Transformers
V
oschamp
41
2
Fl Image Category
Apache-2.0
基于microsoft/resnet-18微调的图像分类模型,在fl_image_category_ds数据集上训练
图像分类
Transformers
F
StephenSKelley
29
0
Vit Model
基于预处理1024配置数据集微调的ViT模型,用于图像分类任务
图像分类
Transformers
V
mm-ai
19
0
Convnextv2 Nano 22k 384
Apache-2.0
ConvNeXt V2是一种纯卷积模型,采用FCMAE框架预训练,在ImageNet-22K数据集上微调,适用于图像分类任务。
图像分类
Transformers
C
facebook
269
1
Convnextv2 Tiny 1k 224
Apache-2.0
ConvNeXt V2是一种纯卷积模型,引入全卷积掩码自编码框架和全局响应归一化层,显著提升卷积网络在识别任务上的性能。
图像分类
Transformers
C
facebook
43.54k
5
Convnextv2 Nano 1k 224
Apache-2.0
ConvNeXt V2是一种纯卷积模型,采用FCMAE框架预训练并在ImageNet-1K数据集上微调,显著提升了纯卷积网络的识别性能。
图像分类
Transformers
C
facebook
132
0
Convnextv2 Pico 1k 224
Apache-2.0
ConvNeXt V2是基于FCMAE框架预训练的纯卷积模型,在ImageNet-1K数据集上微调,适用于图像分类任务。
图像分类
Transformers
C
facebook
94
1
Hq Fer2013
Apache-2.0
基于Google的ViT模型微调的面部表情识别模型,在FER2013数据集上训练,准确率达70.22%。
图像分类
Transformers
H
Piro17
38
0
Vit Base Patch16 224 Finetuned Algae Wirs
Apache-2.0
该模型是基于Google的ViT模型在藻类数据集上微调的视觉分类模型,主要用于藻类图像分类任务。
图像分类
Transformers
V
samitizerxu
20
0
Resnet 50 4 32
Apache-2.0
基于microsoft/resnet-50微调的图像分类模型,在评估集上准确率达到64.1%
图像分类
Transformers
R
Celal11
26
0
Poke Model
Gpl-3.0
基于google/vit-base-patch16-224微调的视觉分类模型,用于识别第一世代宝可梦
图像分类
Transformers
P
torresflo
23
1
Bald Or Not
一个基于PyTorch和HuggingPics的简单图像分类模型,用于判断图像中的人物是否秃头。
图像分类
Transformers
B
mvaloatto
28
3