C

CLIP ViT B 16 DataComp.XL S13b B90k

由 flavour 开发
这是一个基于 DataComp-1B 数据集训练的 CLIP ViT-L/14 模型,支持零样本图像分类和图像文本检索任务。
下载量 39.22k
发布时间 : 7/27/2023
模型介绍
内容详情
替代品

模型简介

该模型使用 OpenCLIP 框架在 DataComp-1B 数据集上训练,主要用于研究零样本图像分类和跨模态检索任务。

模型特点

大规模训练数据
使用 DataComp-1B 数据集的 14 亿样本进行训练
零样本能力
无需微调即可执行多种图像分类任务
跨模态理解
能够理解图像和文本之间的关联

模型能力

零样本图像分类
图像文本检索
跨模态理解

使用案例

研究
零样本图像分类研究
探索模型在不同分类体系下的表现
在 ImageNet-1k 上达到 79.2% 的零样本 top-1 准确率
内容管理
图像检索
基于文本描述检索相关图像