语言:
- 格鲁吉亚语
许可证: apache-2.0
标签:
- 自动语音识别
- mozilla-foundation/common_voice_8_0
- 训练生成
- 格鲁吉亚语
- 鲁棒语音事件
- 对话模型
- hf-asr排行榜
数据集:
- mozilla-foundation/common_voice_8_0
模型索引:
- 名称: sammy786/wav2vec2-xlsr-czech
结果:
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 8
类型: mozilla-foundation/common_voice_8_0
参数: ka
指标:
- 名称: 测试WER
类型: wer
值: 23.9
- 名称: 测试CER
类型: cer
值: 3.59
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: ka
指标:
- 名称: 测试WER
类型: wer
值: 75.07
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音事件 - 测试数据
类型: speech-recognition-community-v2/eval_data
参数: ka
指标:
- 名称: 测试WER
类型: wer
值: 74.41
sammy786/wav2vec2-xlsr-georgian
该模型是基于facebook/wav2vec2-xls-r-1b在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - ka数据集上微调的版本。在评估集(即合并了10%训练数据集与其他开发数据集的集合)上取得了以下结果:
- 损失: 10.54
- 词错误率(WER): 27.53
模型描述
"facebook/wav2vec2-xls-r-1b"模型经过微调。
预期用途与限制
需要更多信息
训练与评估数据
训练数据 -
Common Voice芬兰语train.tsv、dev.tsv和other.tsv
训练过程
创建训练数据集时,合并了所有可用数据集并采用90-10的比例划分。
训练超参数
训练过程中使用的超参数如下:
- 学习率: 0.000045637994662983496
- 训练批次大小: 8
- 评估批次大小: 16
- 随机种子: 13
- 梯度累积步数: 4
- 总训练批次大小: 32
- 优化器: Adam,参数β=(0.9,0.999),ε=1e-08
- 学习率调度器类型: 带重启的余弦退火
- 学习率预热步数: 500
- 训练轮数: 30
- 混合精度训练: 原生AMP
训练结果
步数 |
训练损失 |
验证损失 |
WER |
200 |
4.152100 |
0.823672 |
0.967814 |
400 |
0.889500 |
0.196740 |
0.444792 |
600 |
0.493700 |
0.155659 |
0.366115 |
800 |
0.328000 |
0.138066 |
0.358069 |
1000 |
0.260600 |
0.119236 |
0.324989 |
1200 |
0.217200 |
0.114050 |
0.313366 |
1400 |
0.188800 |
0.112600 |
0.302190 |
1600 |
0.166900 |
0.111154 |
0.295485 |
1800 |
0.155500 |
0.109963 |
0.286544 |
2000 |
0.140400 |
0.107587 |
0.277604 |
2200 |
0.142600 |
0.105662 |
0.277157 |
2400 |
0.135400 |
0.105414 |
0.275369 |
框架版本
- Transformers 4.16.0.dev0
- Pytorch 1.10.0+cu102
- Datasets 1.17.1.dev0
- Tokenizers 0.10.3
评估命令
- 在
mozilla-foundation/common_voice_8_0
数据集的test
分割上进行评估
python eval.py --model_id sammy786/wav2vec2-xlsr-georgian --dataset mozilla-foundation/common_voice_8_0 --config ka --split test