C

Convnext Base 384 22k 1k

由 facebook 开发
ConvNeXT是一个纯卷积模型,受视觉Transformer设计启发,在ImageNet-22k上预训练并在ImageNet-1k上微调,性能优于Transformer。
下载量 797
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

ConvNeXT是一个现代化的卷积神经网络,专为图像分类任务设计,结合了传统卷积网络和Transformer的优点。

模型特点

纯卷积架构
采用纯卷积结构,避免了Transformer的计算复杂度,同时保持了高性能。
现代化设计
从ResNet出发,结合Swin Transformer的设计理念,实现了架构的现代化改进。
高性能
在ImageNet等基准测试中表现优异,声称性能优于Transformer模型。

模型能力

图像分类
视觉特征提取

使用案例

计算机视觉
物体识别
识别图像中的物体类别,如动物、日常用品等。
可准确分类ImageNet-1k的1,000个类别。
场景分类
对复杂场景进行分类,如识别建筑类型、自然环境等。