C

Convnextv2 Huge 22k 384

由 facebook 开发
ConvNeXt V2是一种纯卷积模型,采用FCMAE框架预训练并在ImageNet-22K数据集上微调,显著提升了纯卷积模型的识别性能。
下载量 203
发布时间 : 2/18/2023
模型介绍
内容详情
替代品

模型简介

ConvNeXt V2模型引入了全卷积掩码自编码器框架(FCMAE)和新的全局响应归一化(GRN)层,用于图像分类任务。

模型特点

全卷积掩码自编码器框架
采用FCMAE框架进行预训练,提升了模型的特征学习能力。
全局响应归一化层
引入新的GRN层,增强了模型的识别性能。
高分辨率微调
在ImageNet-22K数据集上以384x384分辨率进行微调,适应高分辨率图像分类。

模型能力

图像分类
视觉特征提取

使用案例

图像识别
动物识别
识别图像中的动物种类,如老虎等。
可准确分类ImageNet中的1,000个类别。
物体识别
识别日常物体,如茶壶等。
在高分辨率图像上表现优异。
场景识别
识别建筑或自然场景,如宫殿等。
能够处理复杂场景的分类任务。