语言:
- 罗马尼亚语
许可证: Apache-2.0
标签:
- 自动语音识别
- 训练生成
- hf-asr排行榜
- mozilla-foundation/common_voice_7_0
- 鲁棒语音事件
数据集:
- mozilla-foundation/common_voice_7_0
模型索引:
- 名称: wav2vec2-xls-r-1b-ro
结果:
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 7.0
类型: mozilla-foundation/common_voice_7_0
参数: ro
指标:
- 名称: 测试WER
类型: wer
值: 99.99
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: ro
指标:
- 名称: 测试WER
类型: wer
值: 99.98
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 测试数据
类型: speech-recognition-community-v2/eval_data
参数: ro
指标:
- 名称: 测试WER
类型: wer
值: 99.99
wav2vec2-xls-r-1b-ro
该模型是基于facebook/wav2vec2-xls-r-1b在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - RO数据集上微调的版本。
在评估集上取得了以下结果:
- 损失: 0.1113
- WER: 0.4770
- CER: 0.0306
模型描述
需要更多信息
预期用途与限制
需要更多信息
训练与评估数据
需要更多信息
训练过程
训练超参数
训练过程中使用了以下超参数:
- 学习率: 3e-05
- 训练批次大小: 8
- 评估批次大小: 8
- 随机种子: 42
- 优化器: Adam,参数为betas=(0.9,0.999)和epsilon=1e-08
- 学习率调度器类型: 线性
- 学习率预热步数: 2000
- 训练轮数: 50.0
- 混合精度训练: 原生AMP
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
WER |
CER |
0.7844 |
1.67 |
1500 |
0.3412 |
0.8600 |
0.0940 |
0.7272 |
3.34 |
3000 |
0.1926 |
0.6409 |
0.0527 |
0.6924 |
5.02 |
4500 |
0.1413 |
0.5722 |
0.0401 |
0.6327 |
6.69 |
6000 |
0.1252 |
0.5366 |
0.0371 |
0.6363 |
8.36 |
7500 |
0.1235 |
0.5741 |
0.0389 |
0.6238 |
10.03 |
9000 |
0.1180 |
0.5542 |
0.0362 |
0.6018 |
11.71 |
10500 |
0.1192 |
0.5694 |
0.0369 |
0.583 |
13.38 |
12000 |
0.1216 |
0.5772 |
0.0385 |
0.5643 |
15.05 |
13500 |
0.1195 |
0.5419 |
0.0371 |
0.5399 |
16.72 |
15000 |
0.1240 |
0.5224 |
0.0370 |
0.5529 |
18.39 |
16500 |
0.1174 |
0.5555 |
0.0367 |
0.5246 |
20.07 |
18000 |
0.1097 |
0.5047 |
0.0339 |
0.4936 |
21.74 |
19500 |
0.1225 |
0.5189 |
0.0382 |
0.4629 |
23.41 |
21000 |
0.1142 |
0.5047 |
0.0344 |
0.4463 |
25.08 |
22500 |
0.1168 |
0.4887 |
0.0339 |
0.4671 |
26.76 |
24000 |
0.1119 |
0.5073 |
0.0338 |
0.4359 |
28.43 |
25500 |
0.1206 |
0.5479 |
0.0363 |
0.4225 |
30.1 |
27000 |
0.1122 |
0.5170 |
0.0345 |
0.4038 |
31.77 |
28500 |
0.1159 |
0.5032 |
0.0343 |
0.4271 |
33.44 |
30000 |
0.1116 |
0.5126 |
0.0339 |
0.3867 |
35.12 |
31500 |
0.1101 |
0.4937 |
0.0327 |
0.3674 |
36.79 |
33000 |
0.1142 |
0.4940 |
0.0330 |
0.3607 |
38.46 |
34500 |
0.1106 |
0.5145 |
0.0327 |
0.3651 |
40.13 |
36000 |
0.1172 |
0.4921 |
0.0317 |
0.3268 |
41.81 |
37500 |
0.1093 |
0.4830 |
0.0310 |
0.3345 |
43.48 |
39000 |
0.1131 |
0.4760 |
0.0314 |
0.3236 |
45.15 |
40500 |
0.1132 |
0.4864 |
0.0317 |
0.312 |
46.82 |
42000 |
0.1124 |
0.4861 |
0.0315 |
0.3106 |
48.49 |
43500 |
0.1116 |
0.4745 |
0.0306 |
框架版本
- Transformers 4.17.0.dev0
- Pytorch 1.10.2+cu102
- Datasets 1.18.2.dev0
- Tokenizers 0.11.0