高精度特征提取
GIST Embedding V0
MIT
GIST-Embedding-v0 是一个基于 sentence-transformers 的句子嵌入模型,主要用于句子相似度计算和特征提取任务。
文本嵌入
英语
G
avsolatorio
252.21k
26
Vit So400m Patch16 Siglip 512.v2 Webli
Apache-2.0
基于SigLIP 2的视觉Transformer模型,专为图像特征提取设计,适用于多语言视觉-语言任务。
文本生成图像
Transformers
V
timm
2,766
0
Aimv2 Large Patch14 448.apple Pt
AIM-v2是一个基于timm库的图像特征提取模型,采用大尺寸补丁设计,适用于高分辨率图像处理。
图像分类
Transformers
A
timm
68
0
Aimv2 Large Patch14 224.apple Pt Dist
AIM-v2是一个基于timm库的图像编码器,采用蒸馏训练方法,适用于图像特征提取任务。
图像分类
Transformers
A
timm
380
1
Aimv2 Huge Patch14 224.apple Pt
AIM-v2是一个高效的图像编码器,基于timm库实现,适用于图像特征提取任务。
图像分类
Transformers
A
timm
93
0
Vit Base Patch16 Siglip 224.webli
Apache-2.0
基于SigLIP的视觉Transformer模型,仅包含图像编码器部分,采用原始注意力池化机制
图像分类
Transformers
V
timm
330
1
Dinov2.large.patch 14.reg 4
Apache-2.0
DINOv2是一个基于视觉变换器的图像特征提取模型,通过引入寄存器机制提升了特征提取能力。
图像特征提取
D
refiners
15
0
Dinov2.large.patch 14
Apache-2.0
DINOv2 large是基于自监督学习的大规模视觉特征提取模型,能够生成鲁棒的图像特征表示。
图像特征提取
D
refiners
20
0
Cvlface Adaface Vit Base Kprpe Webface12m
MIT
基于关键点相对位置编码的人脸识别模型,采用ViT架构并在WebFace12M数据集上训练
人脸相关
Transformers
英语
C
minchul
122
1
Cvlface Arcface Ir101 Webface4m
MIT
基于ArcFace损失函数的深度人脸识别模型,使用IR101架构在WebFace4M数据集上训练
人脸相关
Transformers
英语
C
minchul
44
3
Megadescriptor L 384
基于Swin-L架构的图像特征模型,专为动物重识别任务设计,在生态学领域有广泛应用。
图像分类
PyTorch
M
BVRA
5,957
8