V

Vit Base Patch16 224 In21k Snacks

由 matteopilotto 开发
基于ImageNet-21k预训练的Vision Transformer模型,专门针对零食图像分类任务进行微调
下载量 37
发布时间 : 5/14/2022
模型介绍
内容详情
替代品

模型简介

该模型是在ImageNet-21k上预训练的Vision Transformer,并在Matthijs/snacks零食数据集上进行了微调,专门用于零食图像分类任务。

模型特点

高精度分类
在零食测试集上达到89.29%的准确率
数据增强
使用了多种数据增强技术,包括随机裁剪、水平翻转和锐度调整
迁移学习
基于ImageNet-21k大规模预训练模型进行微调

模型能力

零食图像分类
食品识别
视觉特征提取

使用案例

零售与餐饮
自动结账系统
用于超市自动识别顾客选购的零食商品
可替代人工扫码,提高结账效率
食品库存管理
自动识别货架上的零食商品
帮助实时监控库存情况
健康与营养
饮食记录应用
通过拍照自动记录用户摄入的零食
帮助用户追踪饮食习惯