E

Eva02 Large Patch14 224.mim In22k

由 timm 开发
EVA02特征/表示模型,通过掩码图像建模在ImageNet-22k上预训练,采用视觉Transformer架构,适用于图像分类和特征提取任务。
下载量 280
发布时间 : 3/31/2023
模型介绍
内容详情
替代品

模型简介

EVA-02模型是一款基于视觉Transformer架构的图像特征提取模型,通过掩码图像建模(MIM)在ImageNet-22k数据集上预训练,支持图像分类和特征嵌入任务。

模型特点

掩码图像建模预训练
使用EVA-CLIP作为MIM教师模型进行预训练,提升了模型的特征提取能力。
优化的Transformer架构
采用均值池化、SwiGLU激活函数、旋转位置嵌入(ROPE)等技术,增强了模型性能。
高精度特征提取
在ImageNet-22k等大规模数据集上预训练,能够提取高质量的图像特征。

模型能力

图像分类
图像特征提取
视觉表示学习

使用案例

计算机视觉
图像分类
使用预训练模型对图像进行分类,支持多种类别识别。
在ImageNet-1k上达到高准确率(参见性能比较表)。
特征嵌入
提取图像的特征向量,用于下游任务如目标检测、图像检索等。
生成高质量的图像特征表示。