E

Eva02 Tiny Patch14 224.mim In22k

由 timm 开发
EVA02是一个视觉Transformer模型,通过掩码图像建模在ImageNet-22k上预训练,适用于图像分类和特征提取任务。
下载量 385
发布时间 : 3/31/2023
模型介绍
内容详情
替代品

模型简介

EVA02模型是视觉Transformer,具有均值池化、SwiGLU、旋转位置嵌入(ROPE)等技术,适用于图像分类和特征提取。

模型特点

掩码图像建模预训练
使用EVA-CLIP作为MIM教师进行预训练,提高了模型的表示能力。
高效架构设计
采用均值池化、SwiGLU激活函数和旋转位置嵌入(ROPE)等技术,优化了模型性能。
轻量级模型
仅有5.5百万参数,适合资源受限的环境。

模型能力

图像分类
图像特征提取
视觉表示学习

使用案例

计算机视觉
图像分类
可用于对图像进行分类,支持多种类别识别。
在ImageNet-22k上预训练,具有较高的分类准确率。
特征提取
可用于提取图像的深层特征,适用于下游任务如目标检测、图像检索等。
提供高质量的图像表示。