C

Convnextv2 Femto.fcmae

由 timm 开发
一个基于ConvNeXt-V2的自监督特征表示模型,采用全卷积掩码自编码器框架(FCMAE)进行预训练。
下载量 166
发布时间 : 1/5/2023
模型介绍
内容详情
替代品

模型简介

该模型是一个图像分类/特征主干网络,适用于微调或特征提取任务,未包含预训练头部。

模型特点

自监督预训练
采用全卷积掩码自编码器框架(FCMAE)进行预训练,无需标注数据即可学习有效特征表示。
轻量级设计
仅4.8百万参数和0.8 GMACs运算量,适合资源受限环境。
多任务支持
支持图像分类、特征图提取和图像嵌入等多种计算机视觉任务。

模型能力

图像特征提取
图像分类
生成图像嵌入

使用案例

计算机视觉
图像分类
对输入图像进行分类,输出类别概率分布。
在ImageNet-1k数据集上表现良好
特征提取
提取图像的多层次特征图,可用于下游任务如目标检测或分割。
输出不同尺度的特征图
图像检索
通过图像嵌入实现相似图像检索。
生成紧凑的图像表示向量