语言:
- 西班牙语
许可证: Apache-2.0
标签:
- 自动语音识别
- 训练生成
- hf-asr排行榜
- mozilla-foundation/common_voice_7_0
- 鲁棒语音事件
数据集:
- mozilla-foundation/common_voice_7_0
模型索引:
- 名称: xls-r-spanish-test
结果:
- 任务:
名称: 语音识别
类型: 自动语音识别
数据集:
名称: Common Voice 7
类型: mozilla-foundation/common_voice_7_0
参数: es
指标:
- 名称: 测试WER
类型: wer
值: 13.89
- 名称: 测试CER
类型: cer
值: 3.85
- 任务:
名称: 语音识别
类型: 自动语音识别
数据集:
名称: 鲁棒语音事件 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: es
指标:
- 名称: 测试WER
类型: wer
值: 37.66
- 名称: 测试CER
类型: cer
值: 15.32
- 任务:
名称: 自动语音识别
类型: 自动语音识别
数据集:
名称: 鲁棒语音事件 - 测试数据
类型: speech-recognition-community-v2/eval_data
参数: es
指标:
- 名称: 测试WER
类型: wer
值: 41.17
该模型是基于facebook/wav2vec2-large-xlsr-53在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - ES数据集上微调的版本。
在评估集上取得了以下结果:
模型描述
需要更多信息
预期用途与限制
需要更多信息
训练与评估数据
需要更多信息
训练过程
训练超参数
训练过程中使用了以下超参数:
- 学习率: 7.5e-05
- 训练批次大小: 8
- 评估批次大小: 8
- 随机种子: 42
- 梯度累积步数: 4
- 总训练批次大小: 32
- 优化器: Adam,参数为betas=(0.9,0.999)和epsilon=1e-08
- 学习率调度器类型: 线性
- 学习率预热步数: 2000
- 训练轮数: 5.0
- 混合精度训练: Native AMP
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
WER |
2.953 |
0.15 |
1000 |
2.9528 |
1.0 |
1.1519 |
0.3 |
2000 |
0.3735 |
1.0357 |
1.0278 |
0.45 |
3000 |
0.2529 |
1.0390 |
0.9922 |
0.61 |
4000 |
0.2208 |
1.0270 |
0.9618 |
0.76 |
5000 |
0.2088 |
1.0294 |
0.9364 |
0.91 |
6000 |
0.2019 |
1.0214 |
0.9179 |
1.06 |
7000 |
0.1940 |
1.0294 |
0.9154 |
1.21 |
8000 |
0.1915 |
1.0290 |
0.8985 |
1.36 |
9000 |
0.1837 |
1.0211 |
0.9055 |
1.51 |
10000 |
0.1838 |
1.0273 |
0.8861 |
1.67 |
11000 |
0.1765 |
1.0139 |
0.892 |
1.82 |
12000 |
0.1723 |
1.0188 |
0.8778 |
1.97 |
13000 |
0.1735 |
1.0092 |
0.8645 |
2.12 |
14000 |
0.1707 |
1.0106 |
0.8595 |
2.27 |
15000 |
0.1713 |
1.0186 |
0.8392 |
2.42 |
16000 |
0.1686 |
1.0053 |
0.8436 |
2.57 |
17000 |
0.1653 |
1.0096 |
0.8405 |
2.73 |
18000 |
0.1689 |
1.0077 |
0.8382 |
2.88 |
19000 |
0.1645 |
1.0114 |
0.8247 |
3.03 |
20000 |
0.1647 |
1.0078 |
0.8219 |
3.18 |
21000 |
0.1611 |
1.0026 |
0.8024 |
3.33 |
22000 |
0.1580 |
1.0062 |
0.8087 |
3.48 |
23000 |
0.1578 |
1.0038 |
0.8097 |
3.63 |
24000 |
0.1556 |
1.0057 |
0.8094 |
3.79 |
25000 |
0.1552 |
1.0035 |
0.7836 |
3.94 |
26000 |
0.1516 |
1.0052 |
0.8042 |
4.09 |
27000 |
0.1515 |
1.0054 |
0.7925 |
4.24 |
28000 |
0.1499 |
1.0031 |
0.7855 |
4.39 |
29000 |
0.1490 |
1.0041 |
0.7814 |
4.54 |
30000 |
0.1482 |
1.0068 |
0.7859 |
4.69 |
31000 |
0.1460 |
1.0066 |
0.7819 |
4.85 |
32000 |
0.1464 |
1.0062 |
0.7784 |
5.0 |
33000 |
0.1460 |
1.0063 |
框架版本
- Transformers 4.17.0.dev0
- Pytorch 1.10.2+cu102
- Datasets 1.18.3.dev0
- Tokenizers 0.11.0