V

Vit Base Patch16 224 In21k Wwwwii

由 Zynovia 开发
该模型是基于Google的ViT模型在未知数据集上微调的版本,主要用于图像分类任务。
下载量 22
发布时间 : 9/3/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于Vision Transformer (ViT)架构的图像分类模型,在google/vit-base-patch16-224-in21k基础上进行了微调。

模型特点

基于ViT架构
使用Vision Transformer架构,适合处理图像数据
微调版本
在Google预训练模型基础上进行了微调
中等规模
基于ViT-base架构,参数规模适中

模型能力

图像分类
特征提取

使用案例

计算机视觉
通用图像分类
可用于对常见物体和场景进行分类
验证准确率58.45%,Top-3准确率78.45%