vit-base-patch16-224-finetuned开源图像分类模型 - 适用自定义图像数据集分类

首页

Vit Base Patch16 224 Finetuned

由 clp 开发

基于Google Vision Transformer (ViT)模型微调的图像分类模型，在自定义图像数据集上进行了训练

图像分类

Transformers

开源协议:Apache-2.0 #ViT图像分类 #小样本微调 #224分辨率适配

下载量 30

发布时间 : 11/28/2022

模型简介

该模型是在图像文件夹数据集上对google/vit-base-patch16-224进行微调的版本，主要用于图像分类任务

模型特点

基于ViT架构

使用Vision Transformer架构，适合处理图像分类任务

微调模型

在特定图像数据集上进行微调，适应特定分类需求

中等规模

基于ViT-base模型，平衡了性能和计算资源需求

模型能力

图像分类

视觉特征提取

使用案例

图像识别

通用图像分类

对输入的图像进行分类识别

在评估集上达到33.33%的准确率

训练损失	轮数	步数	验证损失	准确率
无记录	1.0	1	0.6063	0.6667
无记录	2.0	2	0.6958	0.3333
无记录	3.0	3	0.7617	0.3333

属性	详情
模型类型	基于 google/vit-base-patch16-224 微调的图像分类模型
训练数据	imagefolder 数据集
评估指标	准确率

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Vit Base Patch16 224 Finetuned

模型简介

模型特点

模型能力

使用案例

🚀 vit-base-patch16-224-finetuned

📚 详细文档

模型描述

预期用途和限制

训练和评估数据

🔧 技术细节

训练过程

训练超参数

训练结果

框架版本

📄 许可证

📋 模型信息