Vit Base Patch16 224 In21k Finetuned Cifar10 Album Vitvmmrdb Make Model Album Pred

V

Vit Base Patch16 224 In21k Finetuned Cifar10 Album Vitvmmrdb Make Model Album Pred

由 venetis 开发

基于ViT架构的视觉Transformer模型，在CIFAR-10数据集上微调，用于图像分类任务

开源协议:Apache-2.0 #图像分类 #高准确率 #ViT架构

下载量 30

发布时间 : 11/27/2022

模型简介

该模型是基于Google Vision Transformer(ViT)架构的图像分类模型，经过在CIFAR-10数据集上的微调，能够对10类常见物体进行准确分类。

模型特点

高准确率

在CIFAR-10测试集上达到85.72%的准确率

基于Transformer架构

采用Vision Transformer(ViT)架构，利用自注意力机制处理图像

小尺寸图像处理

专为224x224像素尺寸图像优化

模型能力

图像分类

物体识别

视觉特征提取

使用案例

计算机视觉

CIFAR-10图像分类

对CIFAR-10数据集中的10类物体进行分类

准确率85.72%

通用物体识别

识别常见物体如飞机、汽车、鸟类等

🚀 vit-base-patch16-224-in21k-finetuned-cifar10_album_vitVMMRdb_make_model_album_pred

本模型是在 aaraki/vit-base-patch16-224-in21k-finetuned-cifar10 基础上针对 None 数据集进行微调的版本。它在评估集上取得了以下结果：

损失值：0.5462
准确率：0.8594
精确率：0.8556
召回率：0.8594
F1值：0.8544

📚 详细文档

模型描述

暂无更多信息。

预期用途与限制

暂无更多信息。

训练和评估数据

暂无更多信息。

训练过程

训练超参数

训练过程中使用了以下超参数：

学习率：5e - 05
训练批次大小：64
评估批次大小：64
随机种子：42
梯度累积步数：4
总训练批次大小：256
优化器：Adam（β1 = 0.9，β2 = 0.999，ε = 1e - 08）
学习率调度器类型：线性
学习率调度器预热比例：0.1
训练轮数：15

训练结果

训练损失	轮数	步数	验证损失	准确率	精确率	召回率	F1值
4.6112	1.0	839	4.5615	0.1425	0.0837	0.1425	0.0646
3.1177	2.0	1678	2.9595	0.4240	0.3424	0.4240	0.3283
2.0793	3.0	2517	2.0048	0.5771	0.5081	0.5771	0.5029
1.4566	4.0	3356	1.4554	0.6760	0.6333	0.6760	0.6280
1.1307	5.0	4195	1.1319	0.7350	0.7027	0.7350	0.7013
0.9367	6.0	5034	0.9328	0.7738	0.7546	0.7738	0.7503
0.7783	7.0	5873	0.8024	0.7986	0.7893	0.7986	0.7819
0.6022	8.0	6712	0.7187	0.8174	0.8098	0.8174	0.8055
0.5234	9.0	7551	0.6635	0.8313	0.8220	0.8313	0.8217
0.4298	10.0	8390	0.6182	0.8388	0.8337	0.8388	0.8302
0.3618	11.0	9229	0.5953	0.8455	0.8394	0.8455	0.8382
0.3262	12.0	10068	0.5735	0.8501	0.8443	0.8501	0.8436
0.3116	13.0	10907	0.5612	0.8527	0.8488	0.8527	0.8471
0.2416	14.0	11746	0.5524	0.8558	0.8500	0.8558	0.8496
0.2306	15.0	12585	0.5489	0.8572	0.8525	0.8572	0.8519

框架版本

Transformers 4.24.0
Pytorch 1.12.1 + cu113
Datasets 2.7.1
Tokenizers 0.13.2

📄 许可证

本项目采用 Apache - 2.0 许可证。

属性	详情
模型类型	基于微调的 vit - base - patch16 - 224 - in21k 模型
评估指标	准确率、精确率、召回率、F1值

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24