V

Vit Base Letter

由 pittawat 开发
基于Google的ViT基础模型在字母识别数据集上微调的图像分类模型,准确率达98.81%
下载量 93
发布时间 : 3/20/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于Google的ViT基础架构微调得到的字母识别模型,专门用于图像中的字母分类任务。

模型特点

高准确率
在字母识别任务上达到98.81%的准确率
基于ViT架构
使用Vision Transformer基础架构,具有强大的图像特征提取能力
轻量级微调
在预训练模型基础上仅进行4轮微调,训练效率高

模型能力

图像分类
字母识别
字符识别

使用案例

文档处理
手写字母识别
识别扫描文档或照片中的手写字母
准确率98.81%
教育技术
字母学习应用
用于儿童教育应用中识别和验证书写的字母