vit-base-patch32-224-in21k-finetuned-eurosat开源模型

首页

Vit Base Patch32 224 In21k Finetuned Eurosat

由 sshreshtha 开发

基于Google Vision Transformer (ViT)架构的图像分类模型，在food101数据集上微调，用于食品图像分类任务

图像分类

Transformers

开源协议:Apache-2.0 #食品图像分类 #高准确率ViT #迁移学习微调

下载量 30

发布时间 : 11/24/2022

模型简介

该模型是基于Vision Transformer架构的预训练模型，在food101食品分类数据集上进行微调，能够对101种不同类别的食品图像进行分类识别

模型特点

基于Vision Transformer架构

采用先进的Transformer架构处理视觉任务，具有强大的特征提取能力

食品图像分类

专门针对101类食品图像优化的分类模型

高准确率

在food101测试集上达到73.21%的分类准确率

模型能力

食品图像分类

视觉特征提取

多类别图像识别

使用案例

食品识别

餐饮业菜品识别

用于餐厅自动识别菜品图片，实现智能菜单管理

可准确识别101种常见食品类别

健康饮食应用

集成到移动应用中帮助用户识别食物并记录饮食

属性	详情
模型类型	基于`google/vit-base-patch32-224-in21k`微调的图像分类模型
训练数据	food101数据集
评估指标	准确率
评估结果	损失：1.6175；准确率：0.7321

训练损失	轮数	步数	验证损失	准确率
2.6483	1.0	532	2.5574	0.6605
1.8885	2.0	1064	1.8063	0.7182
1.6371	3.0	1596	1.6175	0.7321

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Vit Base Patch32 224 In21k Finetuned Eurosat

模型简介

模型特点

模型能力

使用案例

🚀 vit-base-patch32-224-in21k-finetuned-eurosat

🚀 快速开始

📚 详细文档

模型信息

训练过程

训练超参数

训练结果

框架版本

📄 许可证