V

Vit Base Patch16 224 Finetuned Eurosat

由 Weili 开发
基于ViT架构的视觉Transformer模型,在图像分类任务上微调后达到98.89%的准确率
下载量 32
发布时间 : 12/7/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Google的ViT-base-patch16-224预训练模型,在图像文件夹数据集上进行微调得到的图像分类模型。主要用于高精度图像分类任务。

模型特点

高准确率
在评估集上达到98.89%的分类准确率
基于ViT架构
使用Vision Transformer架构,具有强大的图像特征提取能力
高效微调
仅需3个训练轮次即可达到高性能

模型能力

图像分类
视觉特征提取

使用案例

遥感图像分析
土地覆盖分类
对卫星图像中的土地覆盖类型进行分类
准确率可达98.89%
通用图像分类
物体识别
识别图像中的主要物体类别