V

Vit Finetuned Food101

由 ashaduzzaman 开发
这是一个在Food-101数据集上微调的视觉Transformer模型,用于食物图像分类任务。
下载量 162
发布时间 : 8/28/2024
模型介绍
内容详情
替代品

模型简介

该模型基于Google的ViT架构,专门针对101种食物类别进行优化,适用于饮食追踪、餐厅菜单分析等场景。

模型特点

高准确率食物分类
在Food-101测试集上达到89.6%的准确率,能够准确识别101种不同食物类别。
基于ViT架构
采用视觉Transformer架构,利用自注意力机制捕捉图像全局特征。
迁移学习优化
基于预训练的ViT模型进行微调,有效利用大规模图像数据学习到的特征。

模型能力

食物图像分类
多类别识别
饮食分析

使用案例

饮食健康
自动食物记录
帮助用户通过拍照自动记录饮食内容
准确识别101种常见食物
餐饮行业
菜单分析
自动分析餐厅菜单中的食物分类