C

CLIP ViT B 32 DataComp.XL S13b B90k

由 laion 开发
这是一个基于 DataComp-1B 数据集训练的 CLIP ViT-B/32 模型,用于零样本图像分类和图像文本检索等任务。
下载量 12.12k
发布时间 : 9/29/2023
模型介绍
内容详情
替代品

模型简介

该模型使用 OpenCLIP 框架在 DataComp-1B 数据集上训练,旨在为研究社区提供研究输出,帮助探索零样本、任意图像分类。

模型特点

大规模数据训练
使用 DataComp-1B 数据集的 14 亿样本进行训练,覆盖广泛的视觉概念。
零样本能力
无需特定任务微调即可执行图像分类和检索任务。
研究友好
专为研究社区设计,支持跨学科研究和潜在影响分析。

模型能力

零样本图像分类
图像文本检索
跨模态理解
图像特征提取

使用案例

研究应用
零样本图像分类研究
探索模型在不同类别分类法下的性能表现
在 ImageNet-1k 上实现 72.7% 的零样本 top-1 准确率
跨模态理解研究
研究视觉和语言模态之间的关联学习
潜在应用
图像搜索系统
基于文本查询检索相关图像
内容审核辅助
识别图像中的潜在有害内容