E

Eva02 Large Patch14 224.mim M38m

由 timm 开发
EVA02特征/表示模型,通过掩码图像建模在Merged-38M数据集上预训练,适用于图像分类和特征提取任务。
下载量 571
发布时间 : 3/31/2023
模型介绍
内容详情
替代品

模型简介

EVA-02模型采用视觉Transformer架构,包含均值池化、SwiGLU激活函数、旋转位置嵌入(ROPE)以及MLP中额外的层归一化,主要用于图像分类和特征提取。

模型特点

大规模预训练
在Merged-38M数据集(包含IN-22K、CC12M、CC3M、COCO等)上通过掩码图像建模进行预训练。
高效架构
采用视觉Transformer架构,包含均值池化、SwiGLU激活函数、旋转位置嵌入(ROPE)以及MLP中额外的层归一化。
高性能
在ImageNet-1k上表现出色,Top1准确率达到89.57%。

模型能力

图像分类
图像特征提取

使用案例

计算机视觉
图像分类
用于对图像进行分类,支持多种类别识别。
Top1准确率89.57%,Top5准确率98.918%。
特征提取
提取图像的深层特征,可用于下游任务如目标检测、图像分割等。