V

Vit Base Patch16 224 Cifar10

由 karthiksv 开发
基于Vision Transformer架构的图像分类模型,在CIFAR10数据集上微调
下载量 31
发布时间 : 5/13/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于google/vit-base-patch16-224-in21k在cifar10数据集上微调的版本,用于图像分类任务。

模型特点

基于Vision Transformer架构
采用先进的Transformer架构处理图像数据
CIFAR10微调
在标准CIFAR10数据集上进行微调
小尺寸图像处理
适用于224x224像素尺寸的图像分类

模型能力

图像分类
多类别识别

使用案例

计算机视觉
物体识别
识别CIFAR10数据集中的10类常见物体
准确率10.04%
图像分类系统
构建基于ViT的图像分类系统