V

Vit Base Patch16 224 In21k Finetuned Cifar10 Album Vitvmmrdb Make Model Album Pred

由 venetis 开发
基于ViT架构的视觉Transformer模型,在CIFAR-10数据集上微调,用于图像分类任务
下载量 30
发布时间 : 11/27/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Google Vision Transformer(ViT)架构的图像分类模型,经过在CIFAR-10数据集上的微调,能够对10类常见物体进行准确分类。

模型特点

高准确率
在CIFAR-10测试集上达到85.72%的准确率
基于Transformer架构
采用Vision Transformer(ViT)架构,利用自注意力机制处理图像
小尺寸图像处理
专为224x224像素尺寸图像优化

模型能力

图像分类
物体识别
视觉特征提取

使用案例

计算机视觉
CIFAR-10图像分类
对CIFAR-10数据集中的10类物体进行分类
准确率85.72%
通用物体识别
识别常见物体如飞机、汽车、鸟类等