语言:
- sl
许可证: apache-2.0
标签:
- 自动语音识别
- 从训练器生成
- hf-asr排行榜
- 对话模型
- mozilla-foundation/common_voice_8_0
- 强健语音事件
- sl
数据集:
- mozilla-foundation/common_voice_8_0
模型索引:
- 名称: wav2vec2-xls-r-sl-a1
结果:
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 8
类型: mozilla-foundation/common_voice_8_0
参数: sl
指标:
- 名称: 测试WER
类型: wer
值: 0.20626555409164105
- 名称: 测试CER
类型: cer
值: 0.051648321634392154
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 强健语音事件 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: sl
指标:
- 名称: 测试WER
类型: wer
值: 0.5406156320830592
- 名称: 测试CER
类型: cer
值: 0.22249723590310583
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 强健语音事件 - 测试数据
类型: speech-recognition-community-v2/eval_data
参数: sl
指标:
- 名称: 测试WER
类型: wer
值: 55.24
该模型是基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - SL数据集上微调的版本。
在评估集上取得了以下结果:
- 损失: 0.2756
- 词错误率(WER): 0.2279
评估命令
- 在mozilla-foundation/common_voice_8_0的测试集上评估
python eval.py --model_id DrishtiSharma/wav2vec2-xls-r-sl-a1 --dataset mozilla-foundation/common_voice_8_0 --config sl --split test --log_outputs
- 在speech-recognition-community-v2/dev_data上评估
python eval.py --model_id DrishtiSharma/wav2vec2-xls-r-sl-a1 --dataset speech-recognition-community-v2/dev_data --config sl --split validation --chunk_length_s 10 --stride_length_s 1
训练超参数
训练过程中使用了以下超参数:
- 学习率: 7.1e-05
- 训练批次大小: 32
- 评估批次大小: 32
- 随机种子: 42
- 优化器: Adam, betas=(0.9,0.999), epsilon=1e-08
- 学习率调度器类型: 线性
- 学习率预热步数: 1000
- 训练轮数: 100.0
- 混合精度训练: Native AMP
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
词错误率(WER) |
3.3881 |
6.1 |
500 |
2.9710 |
1.0 |
2.6401 |
12.2 |
1000 |
1.7677 |
0.9734 |
1.5152 |
18.29 |
1500 |
0.5564 |
0.6011 |
1.2191 |
24.39 |
2000 |
0.4319 |
0.4390 |
1.0237 |
30.49 |
2500 |
0.3141 |
0.3175 |
0.8892 |
36.59 |
3000 |
0.2748 |
0.2689 |
0.8296 |
42.68 |
3500 |
0.2680 |
0.2534 |
0.7602 |
48.78 |
4000 |
0.2820 |
0.2506 |
0.7186 |
54.88 |
4500 |
0.2672 |
0.2398 |
0.6887 |
60.98 |
5000 |
0.2729 |
0.2402 |
0.6507 |
67.07 |
5500 |
0.2767 |
0.2361 |
0.6226 |
73.17 |
6000 |
0.2817 |
0.2332 |
0.6024 |
79.27 |
6500 |
0.2679 |
0.2279 |
0.5787 |
85.37 |
7000 |
0.2837 |
0.2316 |
0.5744 |
91.46 |
7500 |
0.2838 |
0.2284 |
0.5556 |
97.56 |
8000 |
0.2763 |
0.2281 |
框架版本
- Transformers 4.17.0.dev0
- Pytorch 1.10.2+cu102
- Datasets 1.18.2.dev0
- Tokenizers 0.11.0