V

Vit Base Patch16 224 In21k Wr

由 Imene 开发
该模型是基于google/vit-base-patch16-224-in21k在未知数据集上微调的视觉Transformer模型,主要用于图像分类任务。
下载量 21
发布时间 : 9/7/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于Vision Transformer架构的图像分类模型,在未知数据集上进行了微调,适用于通用的图像识别任务。

模型特点

基于预训练模型微调
基于google/vit-base-patch16-224-in21k预训练模型进行微调,继承了强大的图像特征提取能力
混合精度训练
使用mixed_float16精度进行训练,兼顾训练速度和模型精度
优化器配置
采用AdamWeightDecay优化器配合PolynomialDecay学习率调度,有助于稳定训练过程

模型能力

图像分类
特征提取

使用案例

计算机视觉
通用图像分类
可用于对常见物体和场景进行分类识别
验证准确率57.7%,前三准确率80.35%