V

Videomae Base Finetuned Signlanguage Last 3

由 ihsanahakiim 开发
基于MCG-NJU/videomae-base微调的视频理解模型,专注于手语识别任务
下载量 21
发布时间 : 3/4/2025
模型介绍
内容详情
替代品

模型简介

该模型是基于VideoMAE架构微调的版本,专门用于手语识别任务。在评估集上达到了72.81%的准确率。

模型特点

视频理解能力
基于VideoMAE架构,擅长从视频序列中提取时空特征
手语识别优化
专门针对手语识别任务进行微调,在评估集上达到72.81%准确率
高效训练
采用线性学习率调度和预热策略,优化训练过程

模型能力

视频分类
手语识别
时空特征提取

使用案例

无障碍技术
手语翻译系统
将手语视频实时转换为文字或语音
在评估集上达到72.81%的识别准确率
教育技术
手语学习辅助
评估学习者手语动作的准确性