语言:
- 葡萄牙语(pt)
许可证: Apache-2.0
标签:
- 自动语音识别
- 训练生成
- 鲁棒语音事件
- 葡萄牙语(pt)
- HF-ASR排行榜
数据集:
- Common Voice
模型索引:
- 名称: wav2vec2-large-xls-r-300m-pt-cv
结果:
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 6
类型: common_voice
参数: pt
指标:
- 名称: 测试WER
类型: wer
值: 24.29
- 名称: 测试CER
类型: cer
值: 7.51
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: sv
指标:
- 名称: 测试WER
类型: wer
值: 55.72
- 名称: 测试CER
类型: cer
值: 21.82
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: pt
指标:
- 名称: 测试WER
类型: wer
值: 47.88
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 测试数据
类型: speech-recognition-community-v2/eval_data
参数: pt
指标:
- 名称: 测试WER
类型: wer
值: 50.78
wav2vec2-large-xls-r-300m-pt-cv
该模型是基于facebook/wav2vec2-xls-r-300m在Common Voice数据集上微调的版本。在评估集上取得了以下结果:
模型描述
需要更多信息
预期用途与限制
需要更多信息
训练与评估数据
需要更多信息
训练过程
训练超参数
训练过程中使用了以下超参数:
- 学习率: 0.0003
- 训练批次大小: 8
- 评估批次大小: 8
- 随机种子: 42
- 梯度累积步数: 2
- 总训练批次大小: 16
- 优化器: Adam,参数β=(0.9,0.999),ε=1e-08
- 学习率调度器类型: 线性
- 学习率预热步数: 500
- 训练轮数: 5
- 混合精度训练: Native AMP
训练结果
训练损失 |
训练轮数 |
步数 |
验证损失 |
WER |
10.9035 |
0.2 |
100 |
4.2750 |
1.0 |
3.3275 |
0.41 |
200 |
3.0334 |
1.0 |
3.0016 |
0.61 |
300 |
2.9494 |
1.0 |
2.1874 |
0.82 |
400 |
1.4355 |
0.8721 |
1.09 |
1.02 |
500 |
0.9987 |
0.7165 |
0.8251 |
1.22 |
600 |
0.7886 |
0.6406 |
0.6927 |
1.43 |
700 |
0.6753 |
0.5801 |
0.6143 |
1.63 |
800 |
0.6300 |
0.5509 |
0.5451 |
1.84 |
900 |
0.5586 |
0.5156 |
0.5003 |
2.04 |
1000 |
0.5493 |
0.5027 |
0.3712 |
2.24 |
1100 |
0.5271 |
0.4872 |
0.3486 |
2.45 |
1200 |
0.4953 |
0.4817 |
0.3498 |
2.65 |
1300 |
0.4619 |
0.4538 |
0.3112 |
2.86 |
1400 |
0.4570 |
0.4387 |
0.3013 |
3.06 |
1500 |
0.4437 |
0.4147 |
0.2136 |
3.27 |
1600 |
0.4176 |
0.4124 |
0.2131 |
3.47 |
1700 |
0.4281 |
0.4194 |
0.2099 |
3.67 |
1800 |
0.3864 |
0.3949 |
0.1925 |
3.88 |
1900 |
0.3926 |
0.3913 |
0.1709 |
4.08 |
2000 |
0.3764 |
0.3804 |
0.1406 |
4.29 |
2100 |
0.3787 |
0.3742 |
0.1342 |
4.49 |
2200 |
0.3645 |
0.3693 |
0.1305 |
4.69 |
2300 |
0.3463 |
0.3625 |
0.1298 |
4.9 |
2400 |
0.3418 |
0.3581 |
框架版本
- Transformers 4.11.3
- PyTorch 1.10.0+cu111
- Datasets 1.13.3
- Tokenizers 0.10.3