A

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V1

由 gary109 开发
该模型是基于wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2数据集上微调得到的自动语音识别模型。
下载量 48
发布时间 : 6/23/2022
模型介绍
内容详情
替代品

模型简介

这是一个用于自动语音识别(ASR)的模型,特别针对音乐节奏游戏StepMania的语音指令进行了优化。

模型特点

基于wav2vec2-large-xlsr-53微调
基于强大的wav2vec2-large-xlsr-53模型进行微调,具备良好的语音识别基础能力
针对StepMania优化
专门针对音乐节奏游戏StepMania的语音指令进行了优化训练
低词错误率
在评估集上取得了0.7344的词错误率(WER)

模型能力

语音识别
音乐游戏指令识别

使用案例

游戏
StepMania语音控制
识别音乐节奏游戏StepMania中的语音指令
词错误率0.7344
语音交互
游戏语音指令识别
识别特定游戏场景中的语音命令