语言:
- 法语
许可证: apache-2.0
标签:
- 自动语音识别
- mozilla-foundation/common_voice_8_0
- 训练生成
- 鲁棒语音事件
- hf-asr排行榜
数据集:
- mozilla-foundation/common_voice_8_0
模型索引:
- 名称: xls-r-300m-fr
结果:
- 任务:
名称: 语音识别
类型: 自动语音识别
数据集:
名称: Common Voice 8.0 法语
类型: mozilla-foundation/common_voice_8_0
参数: fr
指标:
- 名称: 测试WER
类型: wer
值: 36.81
- 任务:
名称: 自动语音识别
类型: 自动语音识别
数据集:
名称: 鲁棒语音事件 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: fr
指标:
- 名称: 测试WER
类型: wer
值: 35.55
- 任务:
名称: 自动语音识别
类型: 自动语音识别
数据集:
名称: 鲁棒语音事件 - 测试数据
类型: speech-recognition-community-v2/eval_data
参数: fr
指标:
- 名称: 测试WER
类型: wer
值: 39.94
该模型是基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - FR数据集上进行微调的版本。
在评估集上取得了以下结果:
模型描述
需要更多信息
预期用途与限制
需要更多信息
训练与评估数据
需要更多信息
训练过程
训练超参数
训练过程中使用了以下超参数:
- 学习率: 0.0001
- 训练批次大小: 64
- 评估批次大小: 64
- 随机种子: 42
- 优化器: Adam,参数为betas=(0.9,0.999)和epsilon=1e-08
- 学习率调度器类型: 线性
- 学习率预热步数: 1500
- 训练轮数: 2.0
- 混合精度训练: 原生AMP
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
WER |
4.3748 |
0.07 |
500 |
3.8784 |
1.0 |
2.8068 |
0.14 |
1000 |
2.8289 |
0.9826 |
1.6698 |
0.22 |
1500 |
0.8811 |
0.7127 |
1.3488 |
0.29 |
2000 |
0.5166 |
0.5369 |
1.2239 |
0.36 |
2500 |
0.4105 |
0.4741 |
1.1537 |
0.43 |
3000 |
0.3585 |
0.4448 |
1.1184 |
0.51 |
3500 |
0.3336 |
0.4292 |
1.0968 |
0.58 |
4000 |
0.3195 |
0.4180 |
1.0737 |
0.65 |
4500 |
0.3075 |
0.4141 |
1.0677 |
0.72 |
5000 |
0.3015 |
0.4089 |
1.0462 |
0.8 |
5500 |
0.2971 |
0.4077 |
1.0392 |
0.87 |
6000 |
0.2870 |
0.3997 |
1.0178 |
0.94 |
6500 |
0.2805 |
0.3963 |
0.992 |
1.01 |
7000 |
0.2748 |
0.3935 |
1.0197 |
1.09 |
7500 |
0.2691 |
0.3884 |
1.0056 |
1.16 |
8000 |
0.2682 |
0.3889 |
0.9826 |
1.23 |
8500 |
0.2647 |
0.3868 |
0.9815 |
1.3 |
9000 |
0.2603 |
0.3832 |
0.9717 |
1.37 |
9500 |
0.2561 |
0.3807 |
0.9605 |
1.45 |
10000 |
0.2523 |
0.3783 |
0.96 |
1.52 |
10500 |
0.2494 |
0.3788 |
0.9442 |
1.59 |
11000 |
0.2478 |
0.3760 |
0.9564 |
1.66 |
11500 |
0.2454 |
0.3733 |
0.9436 |
1.74 |
12000 |
0.2439 |
0.3747 |
0.938 |
1.81 |
12500 |
0.2411 |
0.3716 |
0.9353 |
1.88 |
13000 |
0.2397 |
0.3698 |
0.9271 |
1.95 |
13500 |
0.2388 |
0.3681 |
框架版本
- Transformers 4.17.0.dev0
- Pytorch 1.10.2+cu102
- Datasets 1.18.2.dev0
- Tokenizers 0.11.0