C

Convnextv2 Large 22k 384

由 facebook 开发
ConvNeXt V2是一种纯卷积模型,采用FCMAE框架预训练,在ImageNet-22K数据集上微调,显著提升了纯卷积网络的识别性能。
下载量 571
发布时间 : 2/18/2023
模型介绍
内容详情
替代品

模型简介

ConvNeXt V2是一种纯卷积模型,引入了全卷积掩码自编码器框架(FCMAE)和新的全局响应归一化(GRN)层,适用于图像分类任务。

模型特点

全卷积掩码自编码器框架(FCMAE)
采用FCMAE框架进行预训练,提升了模型的识别性能。
全局响应归一化(GRN)层
引入新的GRN层,增强了模型的表示能力。
高分辨率微调
在ImageNet-22K数据集上以384x384分辨率进行微调,提升了模型的细节识别能力。

模型能力

图像分类
视觉识别

使用案例

图像分类
动物识别
识别图像中的动物种类,如老虎。
物体识别
识别图像中的日常物体,如茶壶。
场景识别
识别图像中的场景类型,如宫殿。