Sigmoid损失优化
Vit Large Patch16 Siglip 256.v2 Webli
Apache-2.0
基于SigLIP 2架构的视觉Transformer模型,专为图像特征提取设计,训练于webli数据集
图像分类
Transformers
V
timm
525
0
Vit Base Patch16 Siglip 224.v2 Webli
Apache-2.0
基于SigLIP 2的ViT模型,专注于图像特征提取,使用webli数据集训练
文本生成图像
Transformers
V
timm
1,992
0
Vit Gopt 16 SigLIP2 384
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类
文本生成图像
V
timm
1,953
1
Vit Gopt 16 SigLIP2 256
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,适用于零样本图像分类任务。
文本生成图像
V
timm
43.20k
0
Vit SO400M 16 SigLIP2 512
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,适用于零样本图像分类任务
文本生成图像
V
timm
1,191
4
Vit SO400M 16 SigLIP2 384
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类任务。
文本生成图像
V
timm
106.30k
2
Vit SO400M 16 SigLIP2 256
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类
文本生成图像
V
timm
998
0
Vit SO400M 14 SigLIP2 378
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类任务
文本生成图像
V
timm
1,596
1
Vit L 16 SigLIP2 512
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类任务
文本生成图像
V
timm
147
2
Vit L 16 SigLIP2 256
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类
文本生成图像
V
timm
888
0
Vit B 16 SigLIP2 512
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类任务
文本生成图像
V
timm
1,442
1
Vit B 16 SigLIP2
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,适用于零样本图像分类任务。
文本生成图像
V
timm
11.26k
0
Vit B 32 SigLIP2 256
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类任务
文本生成图像
V
timm
691
0
Vit B 16 SigLIP2 256
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类任务
文本生成图像
V
timm
10.32k
4
Vit SO400M 14 SigLIP 384
Apache-2.0
基于WebLI数据集训练的SigLIP(语言-图像预训练的Sigmoid损失)模型,适用于零样本图像分类任务。
文本生成图像
V
timm
158.84k
79
Vit SO400M 14 SigLIP
Apache-2.0
一个在WebLI数据集上训练的SigLIP(用于语言-图像预训练的Sigmoid损失)模型,适用于零样本图像分类任务。
文本生成图像
V
timm
79.55k
17
Vit L 16 SigLIP 384
Apache-2.0
基于WebLI数据集训练的SigLIP(Sigmoid Loss for Language-Image Pre-training)模型,用于零样本图像分类任务。
文本生成图像
V
timm
3,008
27
Vit B 16 SigLIP 256
Apache-2.0
一个在WebLI数据集上训练的SigLIP(语言-图像预训练的Sigmoid损失)模型,适用于零样本图像分类任务。
文本生成图像
V
timm
17.15k
1