E

Eva02 Small Patch14 224.mim In22k

由 timm 开发
EVA02特征/表示模型,通过掩码图像建模在ImageNet-22k上预训练,适用于图像分类和特征提取任务。
下载量 705
发布时间 : 3/31/2023
模型介绍
内容详情
替代品

模型简介

EVA-02模型是视觉Transformer,具有均值池化、SwiGLU、旋转位置嵌入(ROPE)等技术,适用于图像分类和特征提取任务。

模型特点

掩码图像建模预训练
使用EVA-CLIP作为MIM教师在ImageNet-22k上进行预训练,提高了模型的表征能力。
先进的Transformer架构
采用均值池化、SwiGLU、旋转位置嵌入(ROPE)等技术,提升了模型性能。
高效计算
参数量为21.6百万,GMACs为6.1,适合在资源有限的环境下部署。

模型能力

图像特征提取
图像分类

使用案例

计算机视觉
图像分类
用于对图像进行分类,支持多种类别识别。
在ImageNet-22k上预训练,具有较高的分类准确率。
特征提取
提取图像的特征表示,可用于下游任务如目标检测、图像检索等。
提供高质量的图像特征表示。