V

Vit Base 224 In21k Ft Cifar10

由 edumunozsala 开发
基于Vision Transformer架构的西班牙语图像分类模型,在CIFAR-10数据集上微调,准确率达97%。
下载量 16
发布时间 : 6/11/2022
模型介绍
内容详情
替代品

模型简介

该模型使用亚马逊SageMaker和Hugging Face深度学习容器进行训练,基础模型是Vision Transformer(基础尺寸模型),在ImageNet-21k数据集上预训练,并在CIFAR-10数据集上微调,用于图像分类任务。

模型特点

高准确率
在CIFAR-10数据集上达到97%的准确率。
基于Vision Transformer
使用Transformer编码器架构,适用于图像分类任务。
微调模型
在ImageNet-21k上预训练,并在CIFAR-10数据集上微调。

模型能力

图像分类
高精度识别

使用案例

图像识别
CIFAR-10图像分类
用于对CIFAR-10数据集中的图像进行分类。
准确率97%