语言:
- 阿萨姆语(as)
许可证: apache-2.0
标签:
- 自动语音识别
- mozilla-foundation/common_voice_8_0
- 训练生成
- 阿萨姆语(as)
- 鲁棒语音事件
- 对话模型
- hf-asr排行榜
数据集:
- mozilla-foundation/common_voice_8_0
模型索引:
- 名称: wav2vec2-large-xls-r-300m-as-v9
结果:
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 8
类型: mozilla-foundation/common_voice_8_0
参数: hsb
指标:
- 名称: 测试WER(词错误率)
类型: wer
值: 0.6163737676810973
- 名称: 测试CER(字错误率)
类型: cer
值: 0.19496397642093005
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: as
指标:
- 名称: 测试WER
类型: wer
值: 不适用
- 名称: 测试CER
类型: cer
值: 不适用
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 8.0
类型: mozilla-foundation/common_voice_8_0
参数: as
指标:
- 名称: 测试WER
类型: wer
值: 61.64
wav2vec2-large-xls-r-300m-as-v9
本模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的版本。在评估集上取得如下结果:
- 损失值: 1.1679
- 词错误率(WER): 0.5761
评估命令
- 在mozilla-foundation/common_voice_8_0测试集上评估:
python eval.py --model_id DrishtiSharma/wav2vec2-large-xls-r-300m-as-v9 --dataset mozilla-foundation/common_voice_8_0 --config as --split test --log_outputs
- 在speech-recognition-community-v2/dev_data上评估:
阿萨姆语(as)在speech-recognition-community-v2/dev_data中不可用
训练超参数
训练过程中使用以下超参数:
- 学习率: 0.000111
- 训练批大小: 16
- 评估批大小: 8
- 随机种子: 42
- 梯度累积步数: 2
- 总训练批大小: 32
- 优化器: Adam (β1=0.9, β2=0.999, ε=1e-08)
- 学习率调度器类型: 线性
- 学习率预热步数: 300
- 训练轮数: 200
- 混合精度训练: Native AMP
训练结果
训练损失 |
训练轮数 |
步数 |
验证损失 |
WER |
8.3852 |
10.51 |
200 |
3.6402 |
1.0 |
3.5374 |
21.05 |
400 |
3.3894 |
1.0 |
2.8645 |
31.56 |
600 |
1.3143 |
0.8303 |
1.1784 |
42.1 |
800 |
0.9417 |
0.6661 |
0.7805 |
52.62 |
1000 |
0.9292 |
0.6237 |
0.5973 |
63.15 |
1200 |
0.9489 |
0.6014 |
0.4784 |
73.67 |
1400 |
0.9916 |
0.5962 |
0.4138 |
84.21 |
1600 |
1.0272 |
0.6121 |
0.3491 |
94.72 |
1800 |
1.0412 |
0.5984 |
0.3062 |
105.26 |
2000 |
1.0769 |
0.6005 |
0.2707 |
115.77 |
2200 |
1.0708 |
0.5752 |
0.2459 |
126.31 |
2400 |
1.1285 |
0.6009 |
0.2234 |
136.82 |
2600 |
1.1209 |
0.5949 |
0.2035 |
147.36 |
2800 |
1.1348 |
0.5842 |
0.1876 |
157.87 |
3000 |
1.1480 |
0.5872 |
0.1669 |
168.41 |
3200 |
1.1496 |
0.5838 |
0.1595 |
178.92 |
3400 |
1.1721 |
0.5778 |
0.1505 |
189.46 |
3600 |
1.1654 |
0.5744 |
0.1486 |
199.97 |
3800 |
1.1679 |
0.5761 |
框架版本
- Transformers 4.16.1
- PyTorch 1.10.0+cu111
- Datasets 1.18.2
- Tokenizers 0.11.0