V

Vit Base 224 In21k Ft Cifar100

由 edumunozsala 开发
基于Vision Transformer架构的图像分类模型,在CIFAR-100数据集上微调,准确率达91.48%
下载量 357
发布时间 : 6/11/2022
模型介绍
内容详情
替代品

模型简介

该模型使用Vision Transformer架构,在ImageNet-21k上预训练后在CIFAR-100数据集上进行微调,专门用于图像分类任务。

模型特点

高准确率
在CIFAR-100测试集上达到91.48%的准确率
基于Transformer架构
采用Vision Transformer架构,适用于图像处理任务
预训练+微调
先在ImageNet-21k上预训练,再在CIFAR-100上微调

模型能力

图像分类
特征提取

使用案例

计算机视觉
物体识别
识别图像中的物体类别
在CIFAR-100的100个类别上表现良好
图像分类系统
构建自动图像分类系统
可用于产品分类、内容审核等场景