D

Deit Small Patch16 224

由 facebook 开发
DeiT是一种更高效训练的Vision Transformer模型,在ImageNet-1k数据集上以224x224分辨率预训练和微调,适用于图像分类任务。
下载量 24.53k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Transformer架构的图像分类模型,通过注意力机制实现数据高效训练,主要用于1000类别的ImageNet图像分类任务。

模型特点

数据高效训练
通过注意力机制实现比传统ViT更高效的训练方式,减少数据需求
小尺寸模型
相比基础模型,参数量更少(22M),适合资源受限场景
高准确率
在ImageNet-1k上达到79.9%的top-1准确率

模型能力

图像分类
特征提取

使用案例

计算机视觉
图像分类
将图像分类为1000个ImageNet类别之一
79.9% top-1准确率