V

Vit SO400M 16 SigLIP I18n 256

由 timm 开发
一个在多语言WebLI数据集上训练的SigLIP(语言图像预训练的Sigmoid损失)模型,支持多语言图像分类任务。
下载量 82
发布时间 : 10/9/2024
模型介绍
内容详情
替代品

模型简介

该模型是基于SigLIP架构的对比图像-文本模型,专门用于零样本图像分类任务,支持多语言处理。

模型特点

多语言支持
使用多语言分词器训练,支持多种语言的图像分类任务。
Sigmoid损失函数
采用Sigmoid损失进行语言图像预训练,提高了模型的分类性能。
零样本分类能力
无需特定训练即可对新类别进行图像分类。

模型能力

零样本图像分类
多语言文本理解
图像特征提取

使用案例

图像分类
多语言图像标签
使用多语言文本标签对图像进行分类
可准确识别图像内容并匹配多语言标签
跨语言图像搜索
使用不同语言查询搜索相关图像
实现跨语言的图像检索能力