C

Convnext Large 224 22k

由 facebook 开发
ConvNeXT是一个纯卷积模型,受视觉Transformer设计启发,在ImageNet-22k数据集上训练而成,性能超越Transformer。
下载量 1,425
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型主要用于图像分类任务,能够将输入图像分类为ImageNet 22k个类别之一。

模型特点

纯卷积架构
采用纯卷积网络设计,避免了Transformer的计算复杂度
现代化改造
基于ResNet架构,借鉴Swin Transformer的理念进行了现代化改造
高性能
宣称性能超越视觉Transformer模型
大规模训练
在ImageNet-22k大规模数据集上训练

模型能力

图像分类
视觉特征提取

使用案例

计算机视觉
通用图像分类
将输入图像分类为ImageNet 22k个类别之一
物体识别
识别图像中的物体类别(如老虎、茶壶等)