V

Vit Base Patch16 224 In21k Wwwwwi

由 Imene 开发
该模型是基于google/vit-base-patch16-224-in21k在未知数据集上微调的视觉Transformer模型,主要用于图像分类任务。
下载量 21
发布时间 : 9/1/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于Vision Transformer架构的图像分类模型,经过微调后可用于特定领域的图像识别任务。

模型特点

基于Vision Transformer架构
采用先进的Transformer架构处理图像数据,具有强大的特征提取能力
预训练模型微调
基于google/vit-base-patch16-224-in21k预训练模型进行微调
混合精度训练
使用mixed_float16精度进行训练,平衡计算效率和模型精度

模型能力

图像分类
特征提取
迁移学习

使用案例

计算机视觉
通用图像分类
可用于对常见物体和场景进行分类识别
在验证集上达到25.4%的准确率