V

Vit Small Patch8 224.dino

由 timm 开发
基于视觉Transformer(ViT)的自监督图像特征提取模型,采用DINO方法训练
下载量 8,904
发布时间 : 12/22/2022
模型介绍
内容详情
替代品

模型简介

这是一个小型视觉Transformer模型,专门用于图像特征提取和分类任务。通过自监督学习方法DINO在ImageNet-1k数据集上预训练,能够捕捉图像的高级语义特征。

模型特点

自监督学习
采用DINO自监督学习方法训练,无需大量标注数据即可学习有效的图像表示
高效架构
使用小型视觉Transformer架构,在保持性能的同时减少计算资源需求
多用途特征
提取的特征可用于多种下游视觉任务,包括分类、检测和分割

模型能力

图像特征提取
图像分类
语义表示学习

使用案例

计算机视觉
图像分类
用于对图像内容进行分类,如识别物体类别
在ImageNet-1k等基准测试上表现良好
特征提取
为其他视觉任务提供预训练特征
可用于迁移学习,提高下游任务性能