V

Vit Bigg 14 CLIPA Datacomp1b

由 UCSC-VLAA 开发
CLIPA-v2模型,专注于零样本图像分类任务,通过对比式图文训练实现高效视觉表示学习
下载量 623
发布时间 : 10/20/2023
模型介绍
内容详情
替代品

模型简介

这是一个基于CLIPA-v2架构的对比式图文模型,专门用于零样本图像分类任务。它通过在大规模数据集上训练,能够理解图像和文本之间的关联,实现无需特定训练的分类能力。

模型特点

高效零样本学习
无需特定任务训练即可实现图像分类
低成本高性能
以相对较低的训练成本实现81.1%的零样本ImageNet准确率
逆缩放定律
采用CLIPA训练的逆缩放定律,优化模型性能与计算资源的平衡

模型能力

零样本图像分类
图文对比学习
跨模态表示学习

使用案例

计算机视觉
图像分类
对任意图像进行分类而无需特定训练
在ImageNet上达到81.1%的零样本准确率
图文检索
根据文本描述检索相关图像或反之