语言: zh-HK
许可证: apache-2.0
标签:
- 自动语音识别
- 训练生成
- hf-asr排行榜
- 鲁棒语音赛事
数据集:
模型索引:
- 名称: Wav2Vec2 XLS-R 300M 粤语 (zh-HK)
结果:
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice
类型: common_voice
参数: zh-HK
指标:
- 名称: 测试CER
类型: cer
值: 31.73
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 7
类型: mozilla-foundation/common_voice_7_0
参数: zh-HK
指标:
- 名称: 测试CER
类型: cer
值: 23.11
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: Common Voice 8
类型: mozilla-foundation/common_voice_8_0
参数: zh-HK
指标:
- 名称: 测试CER
类型: cer
值: 23.02
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音赛事 - 开发数据
类型: speech-recognition-community-v2/dev_data
参数: zh-HK
指标:
- 名称: 测试CER
类型: cer
值: 56.6
- 任务:
名称: 自动语音识别
类型: automatic-speech-recognition
数据集:
名称: 鲁棒语音赛事 - 测试数据
类型: speech-recognition-community-v2/eval_data
参数: zh-HK
指标:
- 名称: 测试CER
类型: cer
值: 55.11
Wav2Vec2 XLS-R 300M 粤语 (zh-HK)
Wav2Vec2 XLS-R 300M 粤语 (zh-HK) 是基于 XLS-R 架构的自动语音识别模型。该模型是在 Common Voice 数据集的 zh-HK
子集上对 Wav2Vec2-XLS-R-300M 进行微调的版本。
该模型使用 HuggingFace 的 PyTorch 框架训练,并参与了由 HuggingFace 组织的 鲁棒语音挑战赛事。所有训练均在 OVH 赞助的 Tesla V100 上完成。
训练使用的所有脚本可在 文件与版本 标签页中找到,训练指标通过 Tensorboard 记录。
模型
模型 |
参数量 |
架构 |
训练/验证数据 (文本) |
wav2vec2-xls-r-300m-zh-HK-v2 |
300M |
XLS-R |
Common Voice zh-HK 数据集 |
评估结果
模型在评估中取得以下结果:
数据集 |
损失 |
CER |
Common Voice |
0.8089 |
31.73% |
Common Voice 7 |
N/A |
23.11% |
Common Voice 8 |
N/A |
23.02% |
鲁棒语音赛事 - 开发数据 |
N/A |
56.60% |
训练流程
训练超参数
训练过程中使用的超参数如下:
- 学习率: 0.0001
- 训练批次大小: 8
- 评估批次大小: 8
- 随机种子: 42
- 梯度累积步数: 4
- 总训练批次大小: 32
- 优化器: Adam,参数为
betas=(0.9, 0.999)
和 epsilon=1e-08
- 学习率调度器类型: 线性
- 学习率预热步数: 2000
- 训练轮数: 100.0
- 混合精度训练: Native AMP
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
Wer |
Cer |
69.8341 |
1.34 |
500 |
80.0722 |
1.0 |
1.0 |
6.6418 |
2.68 |
1000 |
6.6346 |
1.0 |
1.0 |
... |
... |
... |
... |
... |
... |
0.9923 |
97.85 |
36500 |
0.8076 |
1.2278 |
0.3122 |
1.0451 |
99.2 |
37000 |
0.8086 |
1.2451 |
0.3156 |
免责声明
请注意预训练数据集可能存在的偏见可能会影响该模型的结果。
作者
Wav2Vec2 XLS-R 300M 粤语 (zh-HK) 由 Wilson Wongso 训练和评估。所有计算和开发均在 OVH 云上完成。
框架版本
- Transformers 4.17.0.dev0
- Pytorch 1.10.2+cu102
- Datasets 1.18.4.dev0
- Tokenizers 0.11.0