ai-light-dance_stepmania_ft_wav2vec2开源自动语音识别模型

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V1

由 gary109 开发

该模型是基于wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2数据集上微调得到的自动语音识别模型。

下载量 48

发布时间 : 6/23/2022

模型简介

这是一个用于自动语音识别(ASR)的模型，特别针对音乐节奏游戏StepMania的语音指令进行了优化。

基于wav2vec2-large-xlsr-53微调

基于强大的wav2vec2-large-xlsr-53模型进行微调，具备良好的语音识别基础能力

针对StepMania优化

专门针对音乐节奏游戏StepMania的语音指令进行了优化训练

低词错误率

在评估集上取得了0.7344的词错误率(WER)

语音识别

音乐游戏指令识别

游戏

StepMania语音控制

识别音乐节奏游戏StepMania中的语音指令

词错误率0.7344

语音交互

游戏语音指令识别

识别特定游戏场景中的语音命令

训练损失值	轮数	步数	验证损失值	字错率
1.1632	1.0	150	1.2007	0.9875
1.1615	2.0	300	1.1912	0.9875
1.1487	3.0	450	1.1942	0.9875
1.1207	4.0	600	1.1753	0.9875
1.0638	5.0	750	1.1345	0.8214
1.0174	6.0	900	1.1541	0.7665
0.9946	7.0	1050	1.0799	0.7716
0.9694	8.0	1200	1.0848	0.7418
0.9566	9.0	1350	1.0763	0.7344
0.9466	10.0	1500	1.0791	0.7240