多尺度特征提取
Rtdetr V2 R101vd
Apache-2.0
RT-DETRv2是基于DETR架构改进的实时目标检测模型,通过选择性多尺度特征提取和动态数据增强等创新点优化了检测性能。
目标检测
Transformers
英语
R
PekingU
1,892
2
Rtdetr V2 R50vd
Apache-2.0
RT-DETRv2是一种改进的实时目标检测Transformer模型,通过选择性多尺度特征提取和动态数据增强等策略提升性能。
目标检测
Transformers
英语
R
PekingU
15.77k
10
Rtdetr V2 R34vd
Apache-2.0
RT-DETRv2是实时目标检测Transformer模型的改进版本,通过多尺度特征提取和优化训练策略提升性能。
目标检测
Transformers
英语
R
PekingU
886
1
Rtdetr V2 R18vd
Apache-2.0
RT-DETRv2是基于RT-DETR架构优化的实时目标检测模型,通过选择性多尺度特征提取和训练策略改进,在保持实时性能的同时提升检测精度。
目标检测
Transformers
英语
R
PekingU
55.24k
1
Sam2 Hiera Small.fb R896 2pt1
Apache-2.0
基于timm库的SAM2(仅HieraDet图像编码器)权重,源自Facebook的Hiera小型模型。
图像分割
Transformers
S
timm
67
0
Switti
Switti是一种基于尺度感知的文本到图像生成变换器,专注于高质量的图像合成。
图像生成
英语
S
yresearch
410
19
RT DETRv2
RT-DETRv2是改进版实时检测变换器,通过引入即插即用优化方案提升灵活性与实用性,并优化训练策略实现更强性能。
目标检测
Transformers
R
jadechoghari
1,546
2
MSI Net
MIT
MSI-Net是一种视觉显著性模型,通过基于眼动数据训练的上下文编码器-解码器网络预测人类在自然图像上的注视点。
图像分割
M
alexanderkroner
1,380
2
Hiera Base 224
Hiera是一种高效的分层式Transformer架构,通过MAE训练优化空间偏置特性,显著提升参数利用效率
图像分类
Transformers
H
namangarg110
48
0
Some Chives SF
一个用于图像分割任务的深度学习模型,能够将图像中的不同对象或区域进行精确分割。
图像分割
Transformers
S
TristanPermentier
14
0
Focalnet Huge Fl4.ms In22k
MIT
FocalNet是一个基于焦点调制网络的图像分类模型,由微软团队在ImageNet-22k数据集上预训练完成。
图像分类
Transformers
F
timm
103
0
Resnet50
Apache-2.0
ResNet50是基于深度残差学习实现的图像分类模型,通过残差连接解决了深度神经网络中的梯度消失问题。
图像分类
Transformers
R
glasses
13
0
Resnet18
Apache-2.0
ResNet18是基于深度残差学习实现的图像分类模型,通过残差连接解决了深层网络训练困难的问题。
图像分类
Transformers
R
glasses
15
0
Resnet152
Apache-2.0
ResNet152是基于深度残差学习的图像分类模型,通过残差连接解决了深度网络训练中的梯度消失问题。
图像分类
Transformers
R
glasses
14
0