D

Dog Food Vit Base Patch16 224 In21k

由 sasha 开发
这是一个基于Vision Transformer (ViT)架构的图像分类模型,专门用于区分狗和食物的图像。
下载量 32
发布时间 : 6/20/2022

模型简介

该模型在狗与食物数据集上训练,能够高准确率地区分狗和食物的图像。适用于需要自动分类这两种图像的应用场景。

模型特点

高准确率
在测试集上达到99.78%的准确率,表现优异。
基于ViT架构
采用Vision Transformer架构,利用patch16-224-in21k预训练模型。
简单易用
可通过HuggingPics轻松训练和使用。

模型能力

图像分类
区分狗和食物

使用案例

图像分类
宠物与食物识别
自动识别图片中是狗还是食物
准确率高达99.78%
内容过滤
用于过滤或分类包含狗或食物的内容
AIbase
智启未来,您的人工智能解决方案智库
简体中文