C

Convnext Base 224

由 facebook 开发
ConvNeXT是一个纯卷积模型,设计灵感源自视觉Transformer,在ImageNet-1k数据集上训练,用于图像分类任务。
下载量 2,756
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

ConvNeXT是一个现代化的卷积神经网络,通过借鉴Swin Transformer的思想对ResNet进行改造,宣称性能优于视觉Transformer。

模型特点

现代化卷积设计
借鉴视觉Transformer的优点对传统卷积网络进行现代化改造
高性能
宣称在图像分类任务上性能优于视觉Transformer
纯卷积架构
保持纯卷积结构的同时获得与Transformer相当的性能

模型能力

图像分类
视觉特征提取

使用案例

计算机视觉
通用图像分类
将图像分类到ImageNet的1,000个类别中
物体识别
识别图像中的物体类别