V

Vit Base Patch16 224 In21k Finetuned Cassava

由 siddharth963 开发
基于Google Vision Transformer (ViT)架构的图像分类模型,在图像文件夹数据集上微调,准确率达87.06%
下载量 31
发布时间 : 9/27/2022

模型简介

该模型是基于Vision Transformer架构的预训练模型,在特定图像分类任务上进行了微调,适用于图像识别和分类任务

模型特点

高准确率
在评估集上达到87.06%的准确率,表现优异
基于Transformer架构
采用先进的Vision Transformer架构,具有强大的特征提取能力
迁移学习
基于预训练模型微调,适用于特定领域的图像分类任务

模型能力

图像分类
特征提取
迁移学习

使用案例

农业
木薯病害识别
基于模型名称推断可能用于识别木薯植物的病害
准确率87.06%
通用图像识别
图像分类
对输入的图像进行分类识别
AIbase
智启未来,您的人工智能解决方案智库
简体中文