语言:
- sw
许可证: apache-2.0
标签:
- 自动语音识别
- 训练生成
- hf-asr排行榜
- 对话模型
- mozilla-foundation/common_voice_8_0
- 鲁棒语音事件
- sw
数据集:
- mozilla-foundation/common_voice_8_0
模型索引:
- 名称: Akashpb13/Swahili_xlsr
结果:
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 8
类型: mozilla-foundation/common_voice_8_0
参数: sw
指标:
- 名称: 测试WER
类型: wer
值: 0.11763625454589981
- 名称: 测试CER
类型: cer
值: 0.02884228669922436
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: kmr
指标:
- 名称: 测试WER
类型: wer
值: 0.11763625454589981
- 名称: 测试CER
类型: cer
值: 0.02884228669922436
Akashpb13/Swahili_xlsr
该模型是基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - hu数据集上微调的版本。
在评估集(训练数据集的10%与开发数据集合并)上取得了以下结果:
- 损失: 0.159032
- WER: 0.187934
模型描述
"facebook/wav2vec2-xls-r-300m"经过微调。
预期用途与限制
需要更多信息
训练与评估数据
训练数据 -
Common voice Hausa的train.tsv和dev.tsv
仅考虑支持票数高于反对票数的数据点,并在合并common voice 7.0中所有数据集后去除重复项
训练过程
创建训练数据集时,所有可能的数据集被拼接,并采用90-10的比例划分。
训练超参数
训练期间使用的超参数如下:
- 学习率: 0.000096
- 训练批次大小: 16
- 评估批次大小: 16
- 随机种子: 13
- 梯度累积步数: 2
- 学习率调度器类型: cosine_with_restarts
- 学习率预热步数: 500
- 训练轮数: 80
- 混合精度训练: Native AMP
训练结果
步数 |
训练损失 |
验证损失 |
WER |
500 |
4.810000 |
2.168847 |
0.995747 |
1000 |
0.564200 |
0.209411 |
0.303485 |
1500 |
0.217700 |
0.153959 |
0.239534 |
2000 |
0.150700 |
0.139901 |
0.216327 |
2500 |
0.119400 |
0.137543 |
0.208828 |
3000 |
0.099500 |
0.140921 |
0.203045 |
3500 |
0.087100 |
0.138835 |
0.199649 |
4000 |
0.074600 |
0.141297 |
0.195844 |
4500 |
0.066600 |
0.148560 |
0.194127 |
5000 |
0.060400 |
0.151214 |
0.194388 |
5500 |
0.054400 |
0.156072 |
0.192187 |
6000 |
0.051100 |
0.154726 |
0.190322 |
6500 |
0.048200 |
0.159847 |
0.189538 |
7000 |
0.046400 |
0.158727 |
0.188307 |
7500 |
0.046500 |
0.159032 |
0.187934 |
框架版本
- Transformers 4.16.0.dev0
- Pytorch 1.10.0+cu102
- Datasets 1.18.3
- Tokenizers 0.10.3
评估命令
- 在
mozilla-foundation/common_voice_8_0
的test
分割上进行评估
python eval.py --model_id Akashpb13/Swahili_xlsr --dataset mozilla-foundation/common_voice_8_0 --config sw --split test