V

Vit L 14 CLIPA Datacomp1b

由 UCSC-VLAA 开发
CLIPA-v2模型,一种高效的对比式图文模型,专注于零样本图像分类任务。
下载量 278
发布时间 : 10/17/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于CLIPA-v2架构的对比式图文模型,主要用于零样本图像分类。它通过大规模数据集训练,能够在不进行特定任务微调的情况下,直接对图像进行分类。

模型特点

高效零样本分类
能够在没有特定任务微调的情况下,直接对图像进行分类。
大规模数据集训练
使用mlfoundations/datacomp_1b数据集进行训练,具备强大的泛化能力。
低成本高性能
以较低的训练成本实现高准确率的零样本图像分类。

模型能力

零样本图像分类
图文对比学习
多语言支持

使用案例

图像分类
零样本图像分类
直接对未见过类别的图像进行分类,无需微调。
在零样本ImageNet分类任务中达到81.1%的准确率。
多模态应用
图文检索
根据文本描述检索相关图像,或根据图像生成相关文本描述。