E

Eva02 Base Patch16 Clip 224.merged2b S8b B131k

由 timm 开发
基于EVA02架构的CLIP模型,适用于零样本图像分类任务
下载量 29.73k
发布时间 : 4/10/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于EVA02架构的CLIP模型,专门设计用于零样本图像分类任务。它结合了视觉和语言理解能力,能够在没有特定类别训练数据的情况下进行分类。

模型特点

零样本学习能力
无需特定类别的训练数据即可进行分类
视觉-语言联合建模
同时理解图像内容和相关文本描述
高效架构
基于EVA02的改进架构,平衡性能和效率

模型能力

零样本图像分类
图像-文本匹配
跨模态理解

使用案例

图像分类
开放域图像分类
对未见过的类别进行图像分类
在多种零样本分类基准上表现良好
内容检索
跨模态检索
根据文本描述检索图像,或根据图像生成描述