S

Siglip Base Patch16 224

由 Xenova 开发
SigLIP是一种基于视觉-语言预训练的模型,适用于零样本图像分类任务。
下载量 182
发布时间 : 12/23/2023
模型介绍
内容详情
替代品

模型简介

SigLIP是一种结合视觉和语言信息的预训练模型,主要用于零样本图像分类任务,能够根据文本描述对图像进行分类。

模型特点

零样本图像分类
无需训练即可根据文本描述对图像进行分类。
视觉-语言预训练
结合视觉和语言信息进行预训练,提升模型的多模态理解能力。
ONNX兼容
支持ONNX格式,便于在Web端部署和使用。

模型能力

零样本图像分类
文本嵌入向量计算
视觉嵌入向量计算

使用案例

图像分类
动物识别
识别图像中的动物类型,如猫、狗等。
能够准确识别图像中的动物类型。
多模态应用
图像-文本匹配
将图像和文本描述进行匹配,用于检索或分类。
能够有效匹配图像和文本描述。