大规模视觉编码
Siglip2 Giant Opt Patch16 256
Apache-2.0
SigLIP 2 是一个先进的视觉语言模型,整合了多项技术以提升语义理解、定位和密集特征提取能力。
文本生成图像
Transformers
S
google
3,936
1
Aimv2 3b Patch14 224.apple Pt
AIM-v2是一个高效的图像编码器模型,兼容timm框架,适用于计算机视觉任务。
图像分类
Transformers
A
timm
50
0
Aimv2 Large Patch14 224 Distilled
AIMv2是通过多模态自回归目标预训练的视觉模型系列,在多模态理解基准测试中表现优异。
图像分类
A
apple
236
0
Aimv2 3B Patch14 448
AIMv2是通过多模态自回归目标预训练的视觉模型系列,在多个视觉理解基准测试中表现优异。
图像分类
A
apple
161
12
Aimv2 1B Patch14 448
AIMv2 是通过多模态自回归目标预训练的视觉模型系列,在多个视觉理解基准测试中表现优异。
图像分类
A
apple
71
0
Aimv2 Huge Patch14 448
AIMv2是通过多模态自回归目标预训练的视觉模型系列,在多个基准测试中表现优异。
图像分类
A
apple
1,672
3
Aimv2 Large Patch14 448
AIMv2是基于多模态自回归目标预训练的视觉模型系列,在多个基准测试中表现优异
图像分类
A
apple
2,210
5
Aimv2 3B Patch14 336
AIMv2 是一个通过多模态自回归目标预训练的视觉模型系列,在多个多模态理解基准测试中表现优异。
图像分类
A
apple
23
2
Aimv2 Large Patch14 336
AIMv2是基于多模态自回归目标预训练的视觉模型系列,在多项视觉任务中表现优异。
图像分类
A
apple
6,177
3
Aimv2 1B Patch14 224
AIMv2 是通过多模态自回归目标预训练的视觉模型系列,在多项视觉任务中表现优异。
图像分类
A
apple
299
7
Aimv2 Huge Patch14 224
AIMv2 是通过多模态自回归目标预训练的视觉模型系列,在多项基准测试中表现优异。
图像分类
A
apple
54
9
Aimv2 Large Patch14 224
AIMv2是通过多模态自回归目标预训练的视觉模型系列,在多项视觉任务中表现优异。
图像分类
A
apple
759
50