V

VIT Food101 Image Classifier

由 StatsGary 开发
基于Vision Transformer架构的食物图像分类模型,在Food101数据集上训练,准确率达93.3%
下载量 41
发布时间 : 1/30/2023
模型介绍
内容详情
替代品

模型简介

该模型专门用于食物图像分类任务,能够识别101种不同类别的食物。适用于餐饮、健康管理等场景的图像识别需求。

模型特点

高准确率
在Food101测试集上达到93.3%的分类准确率
基于ViT架构
采用先进的Vision Transformer架构,有效捕捉图像全局特征
多类别识别
能够识别101种不同食物类别

模型能力

食物图像分类
多类别识别
高精度图像分析

使用案例

餐饮行业
自动菜单识别
通过拍摄菜品照片自动识别菜品类别
准确率93.3%
健康管理
饮食记录分析
自动识别并记录用户摄入的食物类型