C

Convnextv2 Large 22k 224

由 facebook 开发
ConvNeXt V2是一种纯卷积模型,通过FCMAE框架预训练并在ImageNet-22K数据集上微调,显著提升了纯卷积网络在识别任务上的性能。
下载量 437
发布时间 : 2/19/2023
模型介绍
内容详情
替代品

模型简介

ConvNeXt V2模型基于FCMAE框架预训练,并在ImageNet-22K数据集上以224x224分辨率微调。该模型引入了全卷积掩码自编码器框架(FCMAE)和新的全局响应归一化(GRN)层。

模型特点

全卷积掩码自编码器框架(FCMAE)
引入了FCMAE框架,显著提升了纯卷积网络的性能。
全局响应归一化(GRN)层
新增GRN层,进一步优化了模型的识别能力。
纯卷积架构
采用纯卷积架构,避免了Transformer的计算复杂度,同时保持高性能。

模型能力

图像分类
视觉识别

使用案例

图像分类
动物识别
识别图像中的动物类别,如老虎。
准确分类为ImageNet中的1000个类别之一。
物体识别
识别日常物体,如茶壶。
准确分类为ImageNet中的1000个类别之一。
场景识别
识别复杂场景,如宫殿。
准确分类为ImageNet中的1000个类别之一。