D

Dino Vits8

由 facebook 开发
基于DINO方法自监督训练的视觉Transformer模型,使用8x8图像块处理,适用于图像特征提取任务
下载量 106.97k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该视觉Transformer模型采用DINO自监督方法在ImageNet-1k数据集上预训练,能够学习图像的内在表征,适用于下游计算机视觉任务

模型特点

自监督学习
采用DINO自监督方法训练,无需人工标注数据
8x8图像块处理
将图像分割为8x8像素块进行处理,适合捕捉局部特征
Transformer架构
基于Transformer编码器架构,具有强大的特征提取能力

模型能力

图像特征提取
图像表征学习
计算机视觉任务基础模型

使用案例

计算机视觉
图像分类
可作为基础模型,添加分类头进行图像分类任务
目标检测
提取的图像特征可用于目标检测任务