V

Vit Base Railspace

由 Kaspar 开发
基于google/vit-base-patch16-224-in21k微调的视觉Transformer模型,在评估集上准确率达99.26%
下载量 18
发布时间 : 3/13/2023
模型介绍
内容详情
替代品

模型简介

该模型是针对图像分类任务优化的Vision Transformer模型,在特定数据集上表现出色,尤其擅长高精度分类任务。

模型特点

高准确率
在评估集上达到99.26%的准确率,表现优异
基于ViT架构
采用Vision Transformer基础架构,具有强大的图像特征提取能力
高效微调
仅需4轮训练即可达到高性能

模型能力

图像分类
高精度识别
多类别区分

使用案例

图像分析
地图图像识别
可用于识别和分析地图图像中的特定元素
从示例图像看,模型能准确识别地图图像块
工业质检
适用于生产线上的产品质量检测