C

Convnextv2 Femto 1k 224

由 facebook 开发
ConvNeXt V2是一种纯卷积模型,通过FCMAE框架预训练和GRN层改进,显著提升图像分类性能。
下载量 805
发布时间 : 2/17/2023
模型介绍
内容详情
替代品

模型简介

基于FCMAE框架预训练的纯卷积网络,专为ImageNet-1K图像分类任务优化,支持224x224分辨率输入。

模型特点

全卷积掩码自编码器框架
采用FCMAE预训练框架,增强模型特征学习能力
全局响应归一化
新增GRN层优化特征响应,提升模型识别精度
纯卷积架构
无需注意力机制,保持传统ConvNet的高效特性

模型能力

图像分类
视觉特征提取

使用案例

通用图像识别
动物分类
识别图片中的动物种类(如老虎)
ImageNet千分类准确率
物体识别
识别日常物品(如茶壶)
场景识别
识别建筑或自然场景(如宫殿)