V

Vit Base Patch32 224 In21 Leicester Binary

由 davanstrien 开发
基于Google Vision Transformer (ViT)架构的二分类图像分类模型,在特定数据集上微调实现高精度分类
下载量 15
发布时间 : 12/6/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于ViT架构的视觉Transformer模型,专门针对二分类任务进行了微调,在评估集上表现出色(F1分数0.9873)。

模型特点

高精度分类
在评估集上达到0.9873的F1分数,表现优异
基于ViT架构
采用Vision Transformer架构,利用自注意力机制处理图像
高效微调
基于预训练模型进行微调,节省训练资源

模型能力

图像分类
二分类任务处理
视觉特征提取

使用案例

医学影像分析
病变检测
用于识别医学影像中的特定病变特征
工业质检
缺陷产品检测
识别生产线上的缺陷产品