C

Convnextv2 Base 22k 384

由 facebook 开发
ConvNeXt V2是一种纯卷积模型,采用FCMAE框架预训练并在ImageNet-22K上微调,显著提升卷积网络的识别性能。
下载量 107.32k
发布时间 : 2/19/2023
模型介绍
内容详情
替代品

模型简介

ConvNeXt V2是一种纯卷积模型(ConvNet),引入了全卷积掩码自编码器框架(FCMAE)和新的全局响应归一化(GRN)层,显著提升了纯卷积网络在多种识别基准上的性能。

模型特点

全卷积掩码自编码器框架(FCMAE)
引入FCMAE框架进行预训练,提升模型性能。
全局响应归一化(GRN)层
新增GRN层,进一步优化模型识别能力。
纯卷积架构
采用纯卷积网络设计,避免使用Transformer结构。

模型能力

图像分类
视觉识别

使用案例

图像识别
动物识别
识别图像中的动物种类,如老虎。
物体识别
识别日常物体,如茶壶。
场景识别
识别建筑或场景类型,如宫殿。