V

Vit Base Patch32 224 In21k Finetuned Eurosat

由 sshreshtha 开发
基于Google Vision Transformer (ViT)架构的图像分类模型,在food101数据集上微调,用于食品图像分类任务
下载量 30
发布时间 : 11/24/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Vision Transformer架构的预训练模型,在food101食品分类数据集上进行微调,能够对101种不同类别的食品图像进行分类识别

模型特点

基于Vision Transformer架构
采用先进的Transformer架构处理视觉任务,具有强大的特征提取能力
食品图像分类
专门针对101类食品图像优化的分类模型
高准确率
在food101测试集上达到73.21%的分类准确率

模型能力

食品图像分类
视觉特征提取
多类别图像识别

使用案例

食品识别
餐饮业菜品识别
用于餐厅自动识别菜品图片,实现智能菜单管理
可准确识别101种常见食品类别
健康饮食应用
集成到移动应用中帮助用户识别食物并记录饮食