V

Vit L 16 SigLIP 256

由 timm 开发
基于WebLI数据集训练的SigLIP(语言图像预训练的Sigmoid损失)模型,用于零样本图像分类任务。
下载量 1,516
发布时间 : 10/16/2023
模型介绍
内容详情
替代品

模型简介

该模型是一个对比图像-文本模型,采用Sigmoid损失函数进行预训练,支持零样本图像分类任务。

模型特点

Sigmoid损失函数
采用Sigmoid损失函数进行语言图像预训练,提高了模型的对比学习效果。
零样本分类
支持零样本图像分类,无需特定任务的微调即可应用于新类别。
多框架支持
同时支持OpenCLIP(图像+文本)和timm(仅图像)框架,使用灵活。

模型能力

图像特征提取
文本特征提取
零样本图像分类
图像-文本对比学习

使用案例

图像分类
零样本图像分类
无需微调即可对新的图像类别进行分类。
图像检索
基于文本的图像检索
根据文本描述检索相关图像。