语言:
- 奥里亚语
许可证: apache-2.0
标签:
- 自动语音识别
- mozilla-foundation/common_voice_8_0
- 训练生成
- 奥里亚语
- 鲁棒语音事件
- 对话模型
- hf-asr排行榜
数据集:
- mozilla-foundation/common_voice_8_0
模型索引:
- 名称: wav2vec2-large-xls-r-300m-or-d5
结果:
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 8
类型: mozilla-foundation/common_voice_8_0
参数: 奥里亚语
指标:
- 名称: 测试WER
类型: wer
值: 0.579136690647482
- 名称: 测试CER
类型: cer
值: 0.1572148018392818
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: 奥里亚语
指标:
- 名称: 测试WER
类型: wer
值: 不适用
- 名称: 测试CER
类型: cer
值: 不适用
wav2vec2-large-xls-r-300m-or-d5
该模型是基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - 奥里亚语数据集上微调的版本。
在评估集上取得了以下结果:
- 损失: 0.9571
- 词错误率(WER): 0.5450
评估命令
- 在mozilla-foundation/common_voice_8_0的测试集上评估
python eval.py --model_id DrishtiSharma/wav2vec2-large-xls-r-300m-or-d5 --dataset mozilla-foundation/common_voice_8_0 --config or --split test --log_outputs
- 在speech-recognition-community-v2/dev_data上评估
python eval.py --model_id DrishtiSharma/wav2vec2-large-xls-r-300m-or-d5 --dataset speech-recognition-community-v2/dev_data --config or --split validation --chunk_length_s 10 --stride_length_s 1
训练超参数
训练过程中使用了以下超参数:
- 学习率: 0.000111
- 训练批次大小: 16
- 评估批次大小: 8
- 随机种子: 42
- 梯度累积步数: 2
- 总训练批次大小: 32
- 优化器: Adam,参数为betas=(0.9,0.999),epsilon=1e-08
- 学习率调度器类型: 线性
- 学习率预热步数: 800
- 训练轮数: 200
- 混合精度训练: 原生AMP
训练结果
训练损失 |
训练轮数 |
步数 |
验证损失 |
词错误率(WER) |
9.2958 |
12.5 |
300 |
4.9014 |
1.0 |
3.4065 |
25.0 |
600 |
3.5150 |
1.0 |
1.5402 |
37.5 |
900 |
0.8356 |
0.7249 |
0.6049 |
50.0 |
1200 |
0.7754 |
0.6349 |
0.4074 |
62.5 |
1500 |
0.7994 |
0.6217 |
0.3097 |
75.0 |
1800 |
0.8815 |
0.5985 |
0.2593 |
87.5 |
2100 |
0.8532 |
0.5754 |
0.2097 |
100.0 |
2400 |
0.9077 |
0.5648 |
0.1784 |
112.5 |
2700 |
0.9047 |
0.5668 |
0.1567 |
125.0 |
3000 |
0.9019 |
0.5728 |
0.1315 |
137.5 |
3300 |
0.9295 |
0.5827 |
0.1125 |
150.0 |
3600 |
0.9256 |
0.5681 |
0.1035 |
162.5 |
3900 |
0.9148 |
0.5496 |
0.0901 |
175.0 |
4200 |
0.9480 |
0.5483 |
0.0817 |
187.5 |
4500 |
0.9799 |
0.5516 |
0.079 |
200.0 |
4800 |
0.9571 |
0.5450 |
框架版本
- Transformers 4.16.2
- Pytorch 1.10.0+cu111
- Datasets 1.18.3
- Tokenizers 0.11.0