语言:
- sl
许可证: apache-2.0
标签:
- 自动语音识别
- 训练生成
- hf-asr排行榜
- 对话模型
- mozilla-foundation/common_voice_8_0
- 鲁棒语音事件
- sl
数据集:
- mozilla-foundation/common_voice_8_0
模型索引:
- 名称: wav2vec2-large-xls-r-300m-sl-with-LM-v2
结果:
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 8
类型: mozilla-foundation/common_voice_8_0
参数: sl
指标:
- 名称: 测试WER
类型: wer
值: 0.21695212999560826
- 名称: 测试CER
类型: cer
值: 0.052850080572474256
- 名称: 测试WER (+LM)
类型: wer
值: 0.14551310203484116
- 名称: 测试CER (+LM)
类型: cer
值: 0.03927566711277415
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: sl
指标:
- 名称: 开发WER
类型: wer
值: 0.560722380639029
- 名称: 开发CER
类型: cer
值: 0.2279626093074681
- 名称: 开发WER (+LM)
类型: wer
值: 0.46486802661402354
- 名称: 开发CER (+LM)
类型: cer
值: 0.21105136194592422
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 测试数据
类型: speech-recognition-community-v2/eval_data
参数: sl
指标:
- 名称: 测试WER
类型: wer
值: 46.69
此模型是基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - SL数据集上微调的版本。
在评估集上取得了以下结果:
- 损失: 0.2855
- 词错误率(WER): 0.2401
评估命令
- 在mozilla-foundation/common_voice_8_0的测试集上评估
python eval.py --model_id DrishtiSharma/wav2vec2-large-xls-r-300m-sl-with-LM-v2 --dataset mozilla-foundation/common_voice_8_0 --config sl --split test --log_outputs
- 在speech-recognition-community-v2/dev_data上评估
python eval.py --model_id DrishtiSharma/wav2vec2-large-xls-r-300m-sl-with-LM-v2 --dataset speech-recognition-community-v2/dev_data --config sl --split validation --chunk_length_s 10 --stride_length_s 1
训练超参数
训练过程中使用了以下超参数:
- 学习率: 7e-05
- 训练批次大小: 32
- 评估批次大小: 32
- 随机种子: 42
- 优化器: Adam,参数为betas=(0.9,0.999)和epsilon=1e-08
- 学习率调度器类型: 线性
- 学习率预热步数: 1000
- 训练轮数: 100.0
- 混合精度训练: Native AMP
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
词错误率(WER) |
6.9294 |
6.1 |
500 |
2.9712 |
1.0 |
2.8305 |
12.2 |
1000 |
1.7073 |
0.9479 |
1.4795 |
18.29 |
1500 |
0.5756 |
0.6397 |
1.3433 |
24.39 |
2000 |
0.4968 |
0.5424 |
1.1766 |
30.49 |
2500 |
0.4185 |
0.4743 |
1.0017 |
36.59 |
3000 |
0.3303 |
0.3578 |
0.9358 |
42.68 |
3500 |
0.3003 |
0.3051 |
0.8358 |
48.78 |
4000 |
0.3045 |
0.2884 |
0.7647 |
54.88 |
4500 |
0.2866 |
0.2677 |
0.7482 |
60.98 |
5000 |
0.2829 |
0.2585 |
0.6943 |
67.07 |
5500 |
0.2782 |
0.2478 |
0.6586 |
73.17 |
6000 |
0.2911 |
0.2537 |
0.6425 |
79.27 |
6500 |
0.2817 |
0.2462 |
0.6067 |
85.37 |
7000 |
0.2910 |
0.2436 |
0.5974 |
91.46 |
7500 |
0.2875 |
0.2430 |
0.5812 |
97.56 |
8000 |
0.2852 |
0.2396 |
框架版本
- Transformers 4.17.0.dev0
- Pytorch 1.10.2+cu102
- Datasets 1.18.2.dev0
- Tokenizers 0.11.0