V

Vit Base Patch16 224 Finetuned Cifar10

由 Weili 开发
这是一个基于Vision Transformer (ViT)架构的图像分类模型,在CIFAR10数据集上进行了微调,达到了98.76%的准确率。
下载量 15
发布时间 : 12/7/2022
模型介绍
内容详情
替代品

模型简介

该模型是Google原始ViT模型在CIFAR10数据集上的微调版本,专门用于10类图像分类任务。

模型特点

高准确率
在CIFAR10测试集上达到98.76%的分类准确率
基于Transformer架构
采用Vision Transformer架构,而非传统CNN
小图像处理能力
虽然原始ViT设计用于224x224图像,但已针对CIFAR10的32x32小图像进行优化

模型能力

图像分类
特征提取

使用案例

计算机视觉
物体识别
识别CIFAR10数据集中的10类常见物体
98.76%准确率
教育演示
用于教学演示Transformer在视觉任务中的应用