语言:
- 葡萄牙语(pt)
许可证: Apache-2.0
标签:
- 自动语音识别
- 鲁棒语音事件
- mozilla-foundation/common_voice_8_0
- 基于训练器生成
- hf-asr排行榜
数据集:
- mozilla-foundation/common_voice_8_0
模型索引:
- 名称: xls-r-300m-pt
结果:
- 任务:
名称: 语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 8.0 葡萄牙语
类型: mozilla-foundation/common_voice_8_0
参数: pt
指标:
- 名称: 测试WER(词错误率)
类型: wer
值: 19.361
- 名称: 测试CER(字错误率)
类型: cer
值: 5.533
- 任务:
名称: 语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件-开发数据
类型: speech-recognition-community-v2/dev_data
参数: fr
指标:
- 名称: 验证WER
类型: wer
值: 47.812
- 名称: 验证CER
类型: cer
值: 18.805
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 8.0
类型: mozilla-foundation/common_voice_8_0
参数: pt
指标:
- 名称: 测试WER
类型: wer
值: 19.36
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件-开发数据
类型: speech-recognition-community-v2/dev_data
参数: pt
指标:
- 名称: 测试WER
类型: wer
值: 48.01
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件-测试数据
类型: speech-recognition-community-v2/eval_data
参数: pt
指标:
- 名称: 测试WER
类型: wer
值: 49.21
该模型是基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - PT数据集上微调的版本。
在评估集上取得了以下结果:
模型描述
需要更多信息
预期用途与限制
需要更多信息
训练与评估数据
需要更多信息
训练过程
训练超参数
训练过程中使用了以下超参数:
- 学习率: 0.0002
- 训练批次大小: 32
- 评估批次大小: 32
- 随机种子: 42
- 优化器: Adam(betas=(0.9,0.999), epsilon=1e-08)
- 学习率调度器类型: linear
- 学习率预热步数: 1500
- 训练轮数: 15.0
- 混合精度训练: Native AMP
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
WER |
3.0952 |
0.64 |
500 |
3.0982 |
1.0 |
1.7975 |
1.29 |
1000 |
0.7887 |
0.5651 |
1.4138 |
1.93 |
1500 |
0.5238 |
0.4389 |
1.344 |
2.57 |
2000 |
0.4775 |
0.4318 |
1.2737 |
3.21 |
2500 |
0.4648 |
0.4075 |
1.2554 |
3.86 |
3000 |
0.4069 |
0.3678 |
1.1996 |
4.5 |
3500 |
0.3914 |
0.3668 |
1.1427 |
5.14 |
4000 |
0.3694 |
0.3572 |
1.1372 |
5.78 |
4500 |
0.3568 |
0.3501 |
1.0831 |
6.43 |
5000 |
0.3331 |
0.3253 |
1.1074 |
7.07 |
5500 |
0.3332 |
0.3352 |
1.0536 |
7.71 |
6000 |
0.3131 |
0.3152 |
1.0248 |
8.35 |
6500 |
0.3024 |
0.3023 |
1.0075 |
9.0 |
7000 |
0.2948 |
0.3028 |
0.979 |
9.64 |
7500 |
0.2796 |
0.2853 |
0.9594 |
10.28 |
8000 |
0.2719 |
0.2789 |
0.9172 |
10.93 |
8500 |
0.2620 |
0.2695 |
0.9047 |
11.57 |
9000 |
0.2537 |
0.2596 |
0.8777 |
12.21 |
9500 |
0.2438 |
0.2525 |
0.8629 |
12.85 |
10000 |
0.2409 |
0.2493 |
0.8575 |
13.5 |
10500 |
0.2366 |
0.2440 |
0.8361 |
14.14 |
11000 |
0.2317 |
0.2385 |
0.8126 |
14.78 |
11500 |
0.2290 |
0.2382 |
框架版本
- Transformers 4.17.0.dev0
- Pytorch 1.10.2+cu102
- Datasets 1.18.2.dev0
- Tokenizers 0.11.0