D

Deit Base Distilled Patch16 384

由 facebook 开发
蒸馏版视觉Transformer模型,先在224x224分辨率下预训练,再于384x384分辨率下在ImageNet-1k上微调,通过蒸馏标记从教师模型中学习。
下载量 1,824
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个蒸馏版视觉Transformer(ViT),用于图像分类任务。它使用蒸馏标记从教师CNN模型中学习,支持高分辨率图像处理。

模型特点

蒸馏学习
通过蒸馏标记从教师CNN模型中学习,提高模型性能。
高分辨率支持
支持384x384分辨率图像处理,提升分类精度。
数据高效
在ImageNet-1k上预训练和微调,数据使用高效。

模型能力

图像分类
高分辨率图像处理

使用案例

计算机视觉
ImageNet图像分类
将图像分类为1000个ImageNet类别之一。
Top-1准确率85.2%,Top-5准确率97.2%。