V

Vit H 14 CLIPA Datacomp1b

由 UCSC-VLAA 开发
CLIPA-v2模型,一个高效的对比式图文模型,专为零样本图像分类任务设计。
下载量 65
发布时间 : 10/17/2023

模型简介

该模型是一个基于CLIPA-v2架构的对比式图文模型,主要用于零样本图像分类任务。它通过对比学习将图像和文本映射到同一特征空间,实现无需特定任务训练的零样本分类能力。

模型特点

高效零样本分类
无需特定任务训练即可实现图像分类
大规模数据训练
基于mlfoundations/datacomp_1b数据集训练
高准确率
在ImageNet上实现81.1%的零样本准确率
成本效益高
以较低预算实现高性能

模型能力

零样本图像分类
图像-文本匹配
多模态特征提取

使用案例

图像分类
零样本物体识别
无需训练即可识别新类别的物体
示例中准确识别了法式甜甜圈
多模态应用
图像搜索
通过文本查询搜索相关图像
AIbase
智启未来,您的人工智能解决方案智库
简体中文