V

Vit Base DogSick

由 jungjongho 开发
基于Google的ViT基础模型微调的视觉分类模型,适用于特定领域的图像识别任务
下载量 29
发布时间 : 10/22/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Google的ViT-base-patch16-224-in21k模型进行微调的版本,主要用于图像分类任务。在评估中表现出中等水平的准确率和F1分数。

模型特点

基于ViT架构
采用Vision Transformer架构,利用自注意力机制处理图像数据
中等规模模型
基于ViT-base架构,平衡了性能和计算资源需求
微调优化
在特定领域数据集上进行微调,可能针对特定类型的图像分类任务

模型能力

图像分类
特征提取

使用案例

计算机视觉
特定领域图像分类
可用于特定领域的图像分类任务,如医学图像分析、工业质检等
在评估集上达到61%的准确率和59.8%的F1分数