ViTForImageClassification开源图像分类模型 - 基于CIFAR10微调准确率达96.78%

Vitforimageclassification

由 Andron00e 开发

该模型是基于google/vit-base-patch16-224-in21k在CIFAR10数据集上微调的图像分类模型，准确率达96.78%。

下载量 43

发布时间 : 11/28/2023

模型简介

Vision Transformer (ViT) 图像分类模型，适用于通用图像分类任务。

高准确率

在CIFAR10数据集上达到96.78%的分类准确率

基于Transformer架构

采用Vision Transformer架构，利用自注意力机制处理图像

预训练微调

基于大规模预训练模型进行微调，适应特定分类任务

图像分类

特征提取

计算机视觉

通用图像分类

对常见物体图像进行分类识别

在CIFAR10上达到96.78%准确率

图像理解

提取图像特征用于下游任务