S

Siglip2 So400m Patch16 Naflex

由 google 开发
SigLIP 2 是基于 SigLIP 预训练目标的改进模型,整合了多项技术以提升语义理解、定位和密集特征提取能力。
下载量 159.81k
发布时间 : 2/18/2025
模型介绍
内容详情
替代品

模型简介

SigLIP 2 是一个视觉语言模型,可用于零样本图像分类、图文检索等任务,或作为视觉编码器用于其他视觉任务。

模型特点

增强的语义理解
通过整合解码器损失、全局-局部和掩码预测损失等技术,提升了语义理解能力。
宽高比和分辨率适应性
支持不同宽高比和分辨率的图像处理,增强了模型的适应性。
多任务支持
可用于零样本图像分类、图文检索等多种视觉语言任务。

模型能力

零样本图像分类
图文检索
视觉编码

使用案例

图像分类
零样本图像分类
无需训练即可对图像进行分类,适用于快速部署的场景。
支持自定义候选标签,输出分类概率。
图文检索
图像搜索
根据文本描述检索相关图像。