多语言视觉语言
Vit Gopt 16 SigLIP2 384
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类
文本生成图像
V
timm
1,953
1
Vit Gopt 16 SigLIP2 256
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,适用于零样本图像分类任务。
文本生成图像
V
timm
43.20k
0
Vit SO400M 16 SigLIP2 512
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,适用于零样本图像分类任务
文本生成图像
V
timm
1,191
4
Vit SO400M 16 SigLIP2 384
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类任务。
文本生成图像
V
timm
106.30k
2
Vit SO400M 16 SigLIP2 256
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类
文本生成图像
V
timm
998
0
Vit SO400M 14 SigLIP2 378
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类任务
文本生成图像
V
timm
1,596
1
Vit L 16 SigLIP2 512
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类任务
文本生成图像
V
timm
147
2
Vit L 16 SigLIP2 384
Apache-2.0
一个在WebLI数据集上训练的SigLIP 2视觉语言模型,适用于零样本图像分类任务。
文本生成图像
V
timm
581
0
Vit L 16 SigLIP2 256
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类
文本生成图像
V
timm
888
0
Vit B 16 SigLIP2 512
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类任务
文本生成图像
V
timm
1,442
1
Vit B 16 SigLIP2 384
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,适用于零样本图像分类任务
文本生成图像
V
timm
1,497
0
Vit B 16 SigLIP2
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,适用于零样本图像分类任务。
文本生成图像
V
timm
11.26k
0
Vit B 32 SigLIP2 256
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类任务
文本生成图像
V
timm
691
0
Vit B 16 SigLIP2 256
Apache-2.0
基于WebLI数据集训练的SigLIP 2视觉语言模型,支持零样本图像分类任务
文本生成图像
V
timm
10.32k
4