开源vit - base - food101图像分类模型，精准识别美食，准确率达85.39%！

首页

Vit Base Food101

由 eslamxm 开发

基于Google的ViT模型在Food101数据集上微调的图像分类模型，准确率达到85.39%

图像分类

Transformers

开源协议:Apache-2.0 #食品图像分类 #高准确率 #ViT微调

下载量 445

发布时间 : 5/19/2022

模型简介

该模型是基于google/vit-base-patch16-224-in21k在food101数据集上微调的版本，专门用于食物图像分类任务。

模型特点

高准确率

在Food101测试集上达到85.39%的分类准确率

基于ViT架构

使用Vision Transformer架构，具有强大的图像特征提取能力

轻量级微调

在预训练模型基础上仅进行4轮微调，训练效率高

模型能力

食物图像分类

图像特征提取

使用案例

餐饮行业

智能菜单识别

自动识别餐厅菜品照片并分类

准确率85.39%

食品内容审核

自动识别和分类用户上传的食品图片

健康管理

饮食记录分析

自动识别和记录用户饮食照片中的食物类型

训练损失	轮数	步数	验证损失	准确率
1.657	1.0	4735	0.9732	0.7459
0.9869	2.0	9470	0.7987	0.7884
0.71	3.0	14205	0.6364	0.8311
0.4961	4.0	18940	0.5595	0.8487

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Vit Base Food101

模型简介

模型特点

模型能力

使用案例

🚀 vit-base-food101-demo-v5

🚀 快速开始

📚 详细文档

模型描述

预期用途和限制

训练和评估数据

训练过程

训练超参数

训练结果

框架版本

📄 许可证

🔍 其他信息

模型索引