语言:
- bg
许可证: apache-2.0
标签:
- 自动语音识别
- bg
- 训练生成
- hf-asr排行榜
- mozilla-foundation/common_voice_8_0
- 鲁棒语音事件
数据集:
- mozilla-foundation/common_voice_8_0
模型索引:
- 名称: wav2vec2-large-xls-r-300m-bg-d2
结果:
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 8
类型: mozilla-foundation/common_voice_8_0
参数: bg
指标:
- 名称: 测试WER
类型: wer
值: 0.28775471338792613
- 名称: 测试CER
类型: cer
值: 0.06861971204625049
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: bg
指标:
- 名称: 测试WER
类型: wer
值: 0.49783147459727384
- 名称: 测试CER
类型: cer
值: 0.1591062599627158
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 测试数据
类型: speech-recognition-community-v2/eval_data
参数: bg
指标:
- 名称: 测试WER
类型: wer
值: 51.25
wav2vec2-large-xls-r-300m-bg-d2
该模型是基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - BG数据集上微调的版本。
在评估集上取得了以下结果:
评估命令
- 在mozilla-foundation/common_voice_8_0的测试集上评估
python eval.py --model_id DrishtiSharma/wav2vec2-large-xls-r-300m-bg-d2 --dataset mozilla-foundation/common_voice_8_0 --config bg --split test --log_outputs
- 在speech-recognition-community-v2/dev_data上评估
python eval.py --model_id DrishtiSharma/wav2vec2-large-xls-r-300m-bg-d2 --dataset speech-recognition-community-v2/dev_data --config bg --split validation --chunk_length_s 10 --stride_length_s 1
训练超参数
训练过程中使用了以下超参数:
- 学习率: 0.00025
- 训练批次大小: 16
- 评估批次大小: 8
- 随机种子: 42
- 梯度累积步数: 2
- 总训练批次大小: 32
- 优化器: Adam,参数beta=(0.9,0.999),epsilon=1e-08
- 学习率调度器类型: 线性
- 学习率预热步数: 700
- 训练轮数: 35
- 混合精度训练: Native AMP
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
WER |
6.8791 |
1.74 |
200 |
3.1902 |
1.0 |
3.0441 |
3.48 |
400 |
2.8098 |
0.9864 |
1.1499 |
5.22 |
600 |
0.4668 |
0.5014 |
0.4968 |
6.96 |
800 |
0.4162 |
0.4472 |
0.3553 |
8.7 |
1000 |
0.3580 |
0.3777 |
0.3027 |
10.43 |
1200 |
0.3422 |
0.3506 |
0.2562 |
12.17 |
1400 |
0.3556 |
0.3639 |
0.2272 |
13.91 |
1600 |
0.3621 |
0.3583 |
0.2125 |
15.65 |
1800 |
0.3436 |
0.3358 |
0.1904 |
17.39 |
2000 |
0.3650 |
0.3545 |
0.1695 |
19.13 |
2200 |
0.3366 |
0.3241 |
0.1532 |
20.87 |
2400 |
0.3550 |
0.3311 |
0.1453 |
22.61 |
2600 |
0.3582 |
0.3131 |
0.1359 |
24.35 |
2800 |
0.3524 |
0.3084 |
0.1233 |
26.09 |
3000 |
0.3503 |
0.2973 |
0.1114 |
27.83 |
3200 |
0.3434 |
0.2946 |
0.1051 |
29.57 |
3400 |
0.3474 |
0.2956 |
0.0965 |
31.3 |
3600 |
0.3426 |
0.2907 |
0.0923 |
33.04 |
3800 |
0.3478 |
0.2894 |
0.0894 |
34.78 |
4000 |
0.3421 |
0.2860 |
框架版本
- Transformers 4.16.2
- Pytorch 1.10.0+cu111
- Datasets 1.18.3
- Tokenizers 0.11.0