语言:
- gl
许可证: apache-2.0
标签:
- 自动语音识别
- mozilla-foundation/common_voice_8_0
- 训练生成
- gl
- 鲁棒语音事件
- 对话模型
- hf-asr排行榜
数据集:
- mozilla-foundation/common_voice_8_0
模型索引:
- 名称: Akashpb13/Galician_xlsr
结果:
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 8
类型: mozilla-foundation/common_voice_8_0
参数: kmr
指标:
- 名称: 测试WER
类型: wer
值: 0.11308483789555426
- 名称: 测试CER
类型: cer
值: 0.023982371794871796
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: gl
指标:
- 名称: 测试WER
类型: wer
值: 0.11308483789555426
- 名称: 测试CER
类型: cer
值: 0.023982371794871796
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 8.0
类型: mozilla-foundation/common_voice_8_0
参数: gl
指标:
- 名称: 测试WER
类型: wer
值: 11.31
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 测试数据
类型: speech-recognition-community-v2/eval_data
参数: gl
指标:
- 名称: 测试WER
类型: wer
值: 39.05
Akashpb13/Galician_xlsr
该模型是基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - hu数据集上微调的版本。
在评估集(由训练数据集的10%与无效数据、报告数据、其他数据及开发数据集合并而成)上取得了以下结果:
- 损失: 0.137096
- WER: 0.196230
模型描述
对"facebook/wav2vec2-xls-r-300m"进行了微调。
预期用途与限制
需要更多信息
训练与评估数据
训练数据 -
Common Voice加利西亚语的train.tsv、dev.tsv、invalidated.tsv、reported.tsv和other.tsv
仅考虑支持票数高于反对票数的数据点,并在合并Common Voice 7.0中所有数据集后去除重复项。
训练过程
为创建训练数据集,所有可能的数据集被拼接,并采用90-10的比例划分。
训练超参数
训练过程中使用的超参数如下:
- 学习率: 0.000096
- 训练批次大小: 16
- 评估批次大小: 16
- 随机种子: 13
- 梯度累积步数: 2
- 学习率调度器类型: cosine_with_restarts
- 学习率预热步数: 500
- 训练轮数: 100
- 混合精度训练: Native AMP
训练结果
步数 |
训练损失 |
验证损失 |
WER |
500 |
5.038100 |
3.035432 |
1.000000 |
1000 |
2.180000 |
0.406300 |
0.557964 |
1500 |
0.331700 |
0.153797 |
0.262394 |
2000 |
0.171600 |
0.145268 |
0.235627 |
2500 |
0.125900 |
0.136622 |
0.228087 |
3000 |
0.105400 |
0.131650 |
0.224128 |
3500 |
0.087600 |
0.141032 |
0.217531 |
4000 |
0.078300 |
0.143675 |
0.214515 |
4500 |
0.070000 |
0.144607 |
0.208106 |
5000 |
0.061500 |
0.135259 |
0.202828 |
5500 |
0.055600 |
0.130638 |
0.203959 |
6000 |
0.050500 |
0.137416 |
0.202451 |
6500 |
0.046600 |
0.140379 |
0.200000 |
7000 |
0.040800 |
0.140179 |
0.200377 |
7500 |
0.041000 |
0.138089 |
0.196795 |
8000 |
0.038400 |
0.136927 |
0.197172 |
框架版本
- Transformers 4.16.0.dev0
- Pytorch 1.10.0+cu102
- Datasets 1.18.3
- Tokenizers 0.10.3
评估命令
- 在
mozilla-foundation/common_voice_8_0
的test
分割上进行评估
python eval.py --model_id Akashpb13/Galician_xlsr --dataset mozilla-foundation/common_voice_8_0 --config gl --split test