V

Vit Snacks

由 Shivagowri 开发
基于ViT架构的零食图像分类模型,在Matthijs/snacks数据集上微调,准确率达93.9%
下载量 32
发布时间 : 6/29/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Google的ViT-base-patch16-224-in21k在零食数据集上微调的版本,专门用于识别20种不同种类的零食图像。

模型特点

高准确率
在零食分类任务上达到93.9%的准确率
基于ViT架构
使用Vision Transformer(ViT)作为基础架构,具有良好的图像理解能力
轻量级微调
在预训练模型基础上仅进行5轮微调,效率高

模型能力

零食图像分类
20类零食识别

使用案例

零售与食品
自动零食分类
用于超市或自动售货机的零食自动识别系统
可准确识别20种常见零食
饮食记录应用
帮助用户通过拍照记录零食摄入
自动识别并分类用户摄入的零食