Sigmoid损失函数
Vit SO400M 14 SigLIP2
Apache-2.0
一个在WebLI数据集上训练的SigLIP 2视觉语言模型,适用于零样本图像分类任务。
文本生成图像
V
timm
1,178
0
Vit B 16 SigLIP2 384
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,适用于零样本图像分类任务
文本生成图像
V
timm
1,497
0
Siglip So400m Patch14 224
Apache-2.0
SigLIP是基于CLIP改进的多模态模型,采用更优的Sigmoid损失函数,在WebLi数据集上预训练完成,适用于零样本图像分类和图像-文本检索等任务。
文本生成图像
Transformers
S
google
6,654
53
Siglip Base Patch16 256 Multilingual
Apache-2.0
SigLIP是基于WebLi数据集预训练的改进版CLIP模型,采用Sigmoid损失函数优化图像-文本匹配任务
文本生成图像
Transformers
S
google
175.86k
44
Siglip Large Patch16 384
Apache-2.0
SigLIP是基于WebLi数据集预训练的多模态模型,采用改进的Sigmoid损失函数,适用于零样本图像分类和图文检索任务。
图像生成文本
Transformers
S
google
245.21k
6
Siglip Large Patch16 256
Apache-2.0
SigLIP是基于WebLi数据集预训练的视觉语言模型,采用改进的sigmoid损失函数提升性能
图像生成文本
Transformers
S
google
24.13k
12
Siglip Base Patch16 512
Apache-2.0
SigLIP是基于WebLi数据集预训练的视觉-语言模型,采用改进的sigmoid损失函数,在图像分类和图文检索任务中表现优异。
文本生成图像
Transformers
S
google
237.79k
24
Siglip Base Patch16 384
Apache-2.0
SigLIP是基于WebLi数据集预训练的多模态模型,采用改进的sigmoid损失函数,适用于零样本图像分类和图文检索任务。
图像生成文本
Transformers
S
google
2,570
10
Siglip Base Patch16 256
Apache-2.0
SigLIP是基于WebLi数据集预训练的视觉语言模型,采用改进的Sigmoid损失函数,在图像分类和图文检索任务中表现优异。
文本生成图像
Transformers
S
google
12.71k
5
Siglip Base Patch16 224
Apache-2.0
SigLIP是基于WebLi数据集预训练的视觉语言模型,采用改进的Sigmoid损失函数,优化了图像-文本匹配任务
图像生成文本
Transformers
S
google
250.28k
43