D

Dog Breeds Multiclass Image Classification With Vit

由 wesleyacheng 开发
使用谷歌视觉Transformer架构微调的犬种分类模型,支持120种犬类的图像识别
下载量 584
发布时间 : 7/9/2023
模型介绍
内容详情
替代品

模型简介

该模型基于谷歌视觉Transformer(vit-base-patch16-224-in21k)架构,在斯坦福狗狗数据集上微调训练,专门用于120种犬类的图像分类任务。

模型特点

先进视觉架构
采用谷歌视觉Transformer架构,通过自注意力机制实现全局图像感知
高精度分类
在120种犬类分类任务上达到84%的Top-1准确率和97.1%的Top-3准确率
预训练优势
基于ImageNet-21k大规模预训练模型微调,有效克服数据限制

模型能力

犬种图像分类
多类别图像识别

使用案例

宠物识别
犬种自动识别
通过上传犬只照片自动识别其品种
Top-1准确率84%,Top-3准确率97.1%
宠物管理
宠物档案建立
为宠物医院或收容所自动建立犬种档案