D

Dino Vits16

由 facebook 开发
基于DINO方法自监督训练的视觉Transformer模型,适用于图像特征提取
下载量 47.32k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该视觉Transformer模型采用自监督方式在ImageNet-1k数据集上预训练,可提取图像特征用于下游任务

模型特点

自监督学习
采用DINO方法进行自监督训练,无需人工标注数据
图像块处理
将图像分割为16x16像素块进行处理
通用特征提取
学习到的图像表示可迁移到各种下游视觉任务

模型能力

图像特征提取
图像分类基础模型
视觉表示学习

使用案例

计算机视觉
图像分类
在预训练模型基础上添加分类头进行微调
目标检测
作为特征提取器用于目标检测任务