C

Convnextv2 Huge 22k 512

由 facebook 开发
ConvNeXt V2是一种纯卷积模型,采用FCMAE框架预训练,并在ImageNet-22K数据集上微调,显著提升了纯卷积模型在多种识别基准上的性能。
下载量 211
发布时间 : 2/18/2023
模型介绍
内容详情
替代品

模型简介

ConvNeXt V2模型引入了全卷积掩码自编码器框架(FCMAE)和新的全局响应归一化(GRN)层,适用于图像分类任务。

模型特点

全卷积掩码自编码器框架(FCMAE)
采用FCMAE框架进行预训练,提升了模型的表示学习能力。
全局响应归一化(GRN)层
引入新的GRN层,增强了模型的归一化能力。
高分辨率微调
在ImageNet-22K数据集上以512x512分辨率进行微调,提升了模型的识别精度。

模型能力

图像分类
视觉识别

使用案例

图像识别
动物识别
识别图像中的动物类别,如老虎。
物体识别
识别图像中的日常物体,如茶壶。
场景识别
识别图像中的场景类别,如宫殿。