语言:
- 巴萨语
许可证: apache-2.0
标签:
- 自动语音识别
- mozilla-foundation/common_voice_8_0
- 训练生成
- bas
- 鲁棒语音事件
- 对话模型
- hf-asr排行榜
数据集:
- mozilla-foundation/common_voice_8_0
模型索引:
- 名称: wav2vec2-large-xls-r-300m-bas-v1
结果:
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 8
类型: mozilla-foundation/common_voice_8_0
参数: bas
指标:
- 名称: 测试WER
类型: wer
值: 0.3566497929130234
- 名称: 测试CER
类型: cer
值: 0.1102657634184471
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: bas
指标:
- 名称: 测试WER
类型: wer
值: 不适用
- 名称: 测试CER
类型: cer
值: 不适用
wav2vec2-large-xls-r-300m-bas-v1
该模型是在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - BAS数据集上对facebook/wav2vec2-xls-r-300m进行微调的版本。
在评估集上取得了以下结果:
- 损失: 0.5997
- 词错误率(WER): 0.3870
评估命令
- 在mozilla-foundation/common_voice_8_0的测试集上评估:
python eval.py --model_id DrishtiSharma/wav2vec2-large-xls-r-300m-bas-v1 --dataset mozilla-foundation/common_voice_8_0 --config bas --split test --log_outputs
- 在speech-recognition-community-v2/dev_data上评估:
巴萨语(bas)在speech-recognition-community-v2/dev_data中不可用
训练超参数
训练期间使用了以下超参数:
- 学习率: 0.000111
- 训练批次大小: 16
- 评估批次大小: 8
- 随机种子: 42
- 梯度累积步数: 2
- 总训练批次大小: 32
- 优化器: Adam, betas=(0.9,0.999), epsilon=1e-08
- 学习率调度器类型: 线性
- 学习率预热步数: 500
- 训练轮数: 100
- 混合精度训练: 原生AMP
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
WER |
12.7076 |
5.26 |
200 |
3.6361 |
1.0 |
3.1657 |
10.52 |
400 |
3.0101 |
1.0 |
2.3987 |
15.78 |
600 |
0.9125 |
0.6774 |
1.0079 |
21.05 |
800 |
0.6477 |
0.5352 |
0.7392 |
26.31 |
1000 |
0.5432 |
0.4929 |
0.6114 |
31.57 |
1200 |
0.5498 |
0.4639 |
0.5222 |
36.83 |
1400 |
0.5220 |
0.4561 |
0.4648 |
42.1 |
1600 |
0.5586 |
0.4289 |
0.4103 |
47.36 |
1800 |
0.5337 |
0.4082 |
0.3692 |
52.62 |
2000 |
0.5421 |
0.3861 |
0.3403 |
57.88 |
2200 |
0.5549 |
0.4096 |
0.3011 |
63.16 |
2400 |
0.5833 |
0.3925 |
0.2932 |
68.42 |
2600 |
0.5674 |
0.3815 |
0.2696 |
73.68 |
2800 |
0.5734 |
0.3889 |
0.2496 |
78.94 |
3000 |
0.5968 |
0.3985 |
0.2289 |
84.21 |
3200 |
0.5888 |
0.3893 |
0.2091 |
89.47 |
3400 |
0.5849 |
0.3852 |
0.2005 |
94.73 |
3600 |
0.5938 |
0.3875 |
0.1876 |
99.99 |
3800 |
0.5997 |
0.3870 |
框架版本
- Transformers 4.16.1
- Pytorch 1.10.0+cu111
- Datasets 1.18.2
- Tokenizers 0.11.0