E

Eva02 Large Patch14 Clip 336.merged2b S6b B61k

由 timm 开发
EVA02是一个基于CLIP架构的大规模视觉-语言模型,支持零样本图像分类任务。
下载量 15.78k
发布时间 : 4/10/2023
模型介绍
内容详情
替代品

模型简介

该模型基于CLIP架构,结合了视觉和语言处理能力,适用于零样本图像分类等跨模态任务。

模型特点

零样本学习
支持无需特定任务训练即可完成图像分类任务。
跨模态理解
能够同时处理视觉和语言信息,实现图像与文本的关联。
大规模预训练
基于大规模数据集进行预训练,具备强大的泛化能力。

模型能力

零样本图像分类
跨模态检索
图像-文本匹配

使用案例

图像分类
零样本图像分类
无需特定训练即可对新类别图像进行分类。
跨模态检索
图像-文本检索
根据文本描述检索相关图像,或根据图像生成描述文本。