C

Convnextv2 Pico 1k 224

由 facebook 开发
ConvNeXt V2是基于FCMAE框架预训练的纯卷积模型,在ImageNet-1K数据集上微调,适用于图像分类任务。
下载量 94
发布时间 : 2/17/2023
模型介绍
内容详情
替代品

模型简介

ConvNeXt V2是一种纯卷积模型,引入了全卷积掩码自编码器框架(FCMAE)和全局响应归一化(GRN)层,显著提升了纯卷积网络的性能。

模型特点

全卷积掩码自编码器框架
采用FCMAE框架进行预训练,提升了模型的表示学习能力。
全局响应归一化层
引入新的GRN层,增强了模型的泛化能力和性能。
纯卷积架构
完全基于卷积操作,避免了Transformer的计算开销,保持了高效性。

模型能力

图像分类
视觉特征提取

使用案例

图像识别
动物识别
识别图像中的动物种类,如老虎等。
可准确分类1000种ImageNet类别。
物体识别
识别日常物体,如茶壶等。
在ImageNet-1K数据集上表现优异。