S

Sign Language Classification V1

由 joseluhf11 开发
基于Google Vision Transformer (ViT)微调的手语分类模型,准确率达80.56%
下载量 40
发布时间 : 12/9/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于Google ViT架构微调的手语识别模型,主要用于静态手语图像的分类任务

模型特点

高准确率
在评估集上达到80.56%的分类准确率
基于ViT架构
采用Vision Transformer架构,具有强大的图像特征提取能力
迁移学习
基于预训练的ViT模型进行微调,有效利用已有知识

模型能力

手语图像分类
静态手势识别

使用案例

无障碍技术
手语翻译系统
将手语手势转换为文字或语音
教育
手语学习辅助
帮助学习者识别和验证手语手势