V

Vit Base Cifar10

由 simlaharma 开发
基于ViT架构在CIFAR-10数据集上微调的图像分类模型
下载量 39
发布时间 : 1/4/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于google/vit-base-patch16-224-in21k预训练模型,在CIFAR-10数据集上进行微调的视觉Transformer模型,主要用于图像分类任务。

模型特点

基于Transformer的视觉模型
采用Vision Transformer架构,将自然语言处理中的Transformer成功应用于计算机视觉任务
CIFAR-10微调
在标准图像分类数据集CIFAR-10上进行微调,适用于10类物体识别任务

模型能力

图像分类
物体识别

使用案例

计算机视觉
基础图像分类
对输入图像进行10类物体分类
在CIFAR-10测试集上准确率为10.6%