F

Fun

由 tcvrishank 开发
基于google/vit-base-patch16-224微调的视觉模型,适用于图像分类任务
下载量 16
发布时间 : 3/24/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于Google的ViT(Vision Transformer)架构进行微调的版本,主要用于图像分类任务。

模型特点

基于ViT架构
采用Vision Transformer架构,能够有效处理图像数据
微调模型
在特定数据集上进行微调,适应特定图像分类任务
高效训练
使用混合精度训练(原生AMP),提高训练效率

模型能力

图像分类
视觉特征提取

使用案例

计算机视觉
图像分类
对输入图像进行分类识别