V

Vitforimageclassification

由 Andron00e 开发
该模型是基于google/vit-base-patch16-224-in21k在CIFAR10数据集上微调的图像分类模型,准确率达96.78%。
下载量 43
发布时间 : 11/28/2023
模型介绍
内容详情
替代品

模型简介

Vision Transformer (ViT) 图像分类模型,适用于通用图像分类任务。

模型特点

高准确率
在CIFAR10数据集上达到96.78%的分类准确率
基于Transformer架构
采用Vision Transformer架构,利用自注意力机制处理图像
预训练微调
基于大规模预训练模型进行微调,适应特定分类任务

模型能力

图像分类
特征提取

使用案例

计算机视觉
通用图像分类
对常见物体图像进行分类识别
在CIFAR10上达到96.78%准确率
图像理解
提取图像特征用于下游任务