ai-light-dance_stepmania_ft_wav2vec2-large-xlsr-53-v5开源模型

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V5

由 gary109 开发

基于wav2vec2-large-xlsr-53的自动语音识别模型，在GARY109/AI_LIGHT_DANCE数据集上微调

下载量 160

发布时间 : 6/27/2022

模型简介

该模型是用于自动语音识别(ASR)任务的微调版本，专门针对AI_LIGHT_DANCE数据集优化，能够将语音转换为文本

高性能语音识别

在评估集上取得了0.6622的词错误率(WER)

基于wav2vec2架构

采用强大的wav2vec2-large-xlsr-53作为基础模型

领域优化

在AI_LIGHT_DANCE数据集上进行了专门微调

语音转文本

自动语音识别

游戏音频处理

舞蹈游戏语音指令识别

识别舞蹈游戏中的语音指令

词错误率0.6622

训练损失	轮数	步数	验证损失	字错率（Wer）
0.8867	1.0	376	1.0382	0.6821
0.8861	2.0	752	1.0260	0.6686
0.8682	3.0	1128	1.0358	0.6604
0.8662	4.0	1504	1.0234	0.6665
0.8463	5.0	1880	1.0333	0.6666
0.8573	6.0	2256	1.0163	0.6622
0.8628	7.0	2632	1.0209	0.6551
0.8493	8.0	3008	1.0525	0.6582
0.8371	9.0	3384	1.0409	0.6515
0.8229	10.0	3760	1.0597	0.6523