语言:
-
他加禄语
-
菲律宾语
许可证: 其他
标签:
-
自动语音识别
-
sil-ai/bloom-speech
-
训练生成
数据集:
-
bloom_speech
模型索引:
-
名称: wav2vec2-bloom-speech-tgl
结果:
- 任务:
名称: 语音识别
类型: 自动语音识别
数据集:
名称: Bloom Speech 他加禄语
类型: sil-ai/bloom-speech
参数: tgl
指标:
- 名称: 测试WER
类型: wer
值: 24.57
- 名称: 测试CER
类型: cer
值: 7.69
额外授权提示: |-
获取此模型前还需一步确认。
本模型为开放访问,仅限非商业用途,并受SIL国际AI与NLP RAIL-M许可证进一步规范权利与使用条款。
SIL RAIL-M许可证规定:
- 禁止利用模型故意生成或传播非法或有害内容。特别禁止以伤害或歧视原住民为目的使用模型。
- 对于非商业用途生成的输出内容,SIL不主张任何权利,用户可自由使用但需自负责任,且不得违反许可证条款。
- 允许非商业性重新分发模型权重及服务化使用。若如此做,须包含相同的使用限制条款,并向所有用户提供SIL国际AI与NLP RAIL-M许可证副本(请完整仔细阅读)。完整许可证见: https://huggingface.co/spaces/sil-ai/model-license
点击下方"访问仓库",即表示同意您的联系信息(邮箱与用户名)可与模型作者共享。
如有商业用途咨询,请邮件联系。
额外授权字段:
我已阅读并同意许可证条款: 复选框
wav2vec2-bloom-speech-tgl

模型描述
本模型是基于facebook/wav2vec2-xls-r-300m在SIL-AI/bloom-speech - 他加禄语数据集上微调的版本。
在评估集上达到以下结果:
- 损失值: 0.9606
- 词错误率: 0.2457
- 字错误率: 0.0769
用户应参考原始模型获取推理使用教程。
用途与限制
使用者须遵守SIL RAIL-M许可证。
本模型作为概念验证创建,不保证在特定场景下的性能表现。
训练与评估数据
训练集、验证集和测试集来自同一语料库,确保无重复文件。
训练流程
基于Hugging Face Transformers代码库示例,采用标准XLS-R微调方法。
训练超参数
训练期间使用以下超参数:
- 学习率: 0.0003
- 训练批次大小: 16
- 评估批次大小: 8
- 随机种子: 42
- 梯度累积步数: 2
- 总训练批次大小: 32
- 优化器: Adam,参数β=(0.9,0.999),ε=1e-08
- 学习率调度器类型: 线性
- 学习率预热步数: 250
- 训练轮次: 1000.0
- 混合精度训练: 原生AMP
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
词错误率 |
字错误率 |
无记录 |
22.73 |
250 |
0.9218 |
0.5239 |
0.1605 |
2.044 |
45.45 |
500 |
0.7345 |
0.3717 |
0.0981 |
2.044 |
68.18 |
750 |
0.7742 |
0.35 |
0.0957 |
0.0713 |
90.91 |
1000 |
0.8898 |
0.3196 |
0.0883 |
0.0713 |
113.64 |
1250 |
0.9236 |
0.3478 |
0.1044 |
0.0409 |
136.36 |
1500 |
0.8082 |
0.3174 |
0.0883 |
0.0409 |
159.09 |
1750 |
0.8353 |
0.2826 |
0.0824 |
0.0287 |
181.82 |
2000 |
0.7737 |
0.2783 |
0.0859 |
0.0287 |
204.55 |
2250 |
1.1609 |
0.2891 |
0.0871 |
0.0146 |
227.27 |
2500 |
0.9606 |
0.2457 |
0.0769 |
0.0146 |
250.0 |
2750 |
0.9115 |
0.2717 |
0.0777 |
0.015 |
272.73 |
3000 |
0.8434 |
0.3130 |
0.0859 |
0.015 |
295.45 |
3250 |
1.0805 |
0.3087 |
0.0961 |
框架版本
- Transformers 4.21.0.dev0
- Pytorch 1.9.0+cu111
- Datasets 2.2.2
- Tokenizers 0.12.1