C

Convnext Base 224 22k

由 facebook 开发
ConvNeXT是一个纯卷积模型,其设计灵感来自视觉Transformer,宣称性能优于视觉Transformer。该模型在224x224分辨率下基于ImageNet-22k数据集训练而成。
下载量 1,797
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

ConvNeXT是一个纯卷积模型(ConvNet),其设计灵感来自视觉Transformer,并宣称性能优于后者。作者以ResNet为起点,借鉴Swin Transformer的思想对其进行了'现代化'改造。

模型特点

纯卷积架构
采用纯卷积架构设计,灵感来自视觉Transformer,但性能更优
现代化改造
以ResNet为起点,借鉴Swin Transformer思想进行现代化改造
高分辨率训练
在224x224分辨率下训练,适合高精度图像分类任务

模型能力

图像分类
视觉特征提取

使用案例

计算机视觉
通用图像分类
将图像分类到ImageNet的22k个类别中