V

Vit H 14 CLIPA 336 Datacomp1b

由 UCSC-VLAA 开发
CLIPA-v2模型,一种高效的对比式图文模型,专注于零样本图像分类任务。
下载量 493
发布时间 : 10/17/2023

模型简介

该模型基于CLIPA-v2架构,通过对比学习实现图像和文本的联合表示,特别适用于零样本图像分类场景。

模型特点

高效零样本分类
在有限预算下实现高精度的零样本ImageNet分类(81.1%准确率)
反比例缩放优化
采用创新的训练方法,实现计算资源与模型性能的高效平衡
大规模数据训练
基于datacomp_1b数据集训练,具有强大的泛化能力

模型能力

零样本图像分类
图像-文本匹配
跨模态特征提取

使用案例

图像理解
零样本图像分类
无需特定训练即可对新类别图像进行分类
在ImageNet上达到81.1%准确率
内容审核
违规内容检测
识别不符合规定的图像内容
AIbase
智启未来,您的人工智能解决方案智库
简体中文