xls-r-1B-te免费开源！实现泰卢固语自动语音识别，实用之选！

首页

Xls R 1B Te

由 chmanoj 开发

基于facebook/wav2vec2-xls-r-1b在OPENSLR_SLR66-NA数据集上微调的泰卢固语语音识别模型，支持自动语音识别任务。

语音识别

Transformers

其他开源协议:Apache-2.0 #泰卢固语语音识别 #低词错误率 #大模型微调

下载量 18

发布时间 : 3/2/2022

模型简介

该模型是针对泰卢固语优化的自动语音识别系统，基于XLS-R架构，在OpenSLR的SLR66数据集上微调，适用于泰卢固语语音转文本任务。

模型特点

高精度泰卢固语识别

在测试集上达到20.624%的词错误率(WER)和3.979%的字错误率(CER)

大规模预训练基础

基于facebook/wav2vec2-xls-r-1b模型微调，继承了大规模预训练模型的强大特征提取能力

支持语言模型解码

可通过集成语言模型进一步提升识别准确率，WER从26.14%提升至20.69%

模型能力

泰卢固语语音识别

语音转文本

支持语言模型集成

使用案例

语音转录

泰卢固语语音转录

将泰卢固语语音内容转换为文本

在测试集上达到20.624% WER

语音助手

泰卢固语语音交互

为泰卢固语用户提供语音交互能力

🚀 xls-r-1B-te模型

本模型是基于自动语音识别技术的模型，在OPENSLR_SLR66 - NA数据集上对facebook/wav2vec2-xls-r-1b进行微调得到，能有效提升语音识别的准确性。

🚀 快速开始

该模型是facebook/wav2vec2-xls-r-1b在OPENSLR_SLR66 - NA数据集上的微调版本。它在评估集上取得了以下结果：

损失值：0.3119
词错误率（Wer）：0.2613

评估指标

指标	划分	是否使用语言模型解码	值
词错误率（WER）	训练集	否	5.36
字符错误率（CER）	训练集	否	1.11
词错误率（WER）	测试集	否	26.14
字符错误率（CER）	测试集	否	4.93
词错误率（WER）	训练集	是	5.04
字符错误率（CER）	训练集	是	1.07
词错误率（WER）	测试集	是	20.69
字符错误率（CER）	测试集	是	3.986

📚 详细文档

模型信息

属性	详情
模型类型	自动语音识别
训练数据	openslr、SLR66
评估指标	词错误率（wer）

模型索引

名称：xls-r-1B-te
- 结果：
  - 任务：
    - 类型：自动语音识别
    - 名称：语音识别
  - 数据集：
    - 类型：openslr
    - 名称：Open SLR
    - 参数：SLR66
  - 评估指标：
    - 类型：wer
    - 值：20.624
    - 名称：测试词错误率（Test WER）
    - 类型：cer
    - 值：3.979
    - 名称：测试字符错误率（Test CER）
    - 类型：wer
    - 值：26.14777618364419
    - 名称：测试词错误率（无语言模型）（Test WER (without LM)）
    - 类型：cer
    - 值：4.932543184970369
    - 名称：测试字符错误率（无语言模型）（Test CER (without LM)）

🔧 技术细节

训练过程

训练超参数

训练期间使用了以下超参数：

学习率：2e - 05
训练批次大小：16
评估批次大小：4
随机种子：42
梯度累积步数：2
总训练批次大小：32
优化器：Adam（β1 = 0.9，β2 = 0.999，ε = 1e - 08）
学习率调度器类型：线性
学习率调度器热身步数：2000
训练轮数：150.0
混合精度训练：原生自动混合精度（Native AMP）

训练结果

训练损失	轮数	步数	验证损失	词错误率（Wer）
2.9038	4.8	500	3.0125	1.0
1.3777	9.61	1000	0.8681	0.8753
1.1436	14.42	1500	0.6256	0.7961
1.0997	19.23	2000	0.5244	0.6875
1.0363	24.04	2500	0.4585	0.6276
0.7996	28.84	3000	0.4072	0.5295
0.825	33.65	3500	0.3590	0.5222
0.8018	38.46	4000	0.3678	0.4671
0.7545	43.27	4500	0.3474	0.3962
0.7375	48.08	5000	0.3224	0.3869
0.6198	52.88	5500	0.3233	0.3630
0.6608	57.69	6000	0.3029	0.3308
0.645	62.5	6500	0.3195	0.3722
0.5249	67.31	7000	0.3004	0.3202
0.4875	72.11	7500	0.2826	0.2992
0.5171	76.92	8000	0.2962	0.2976
0.4974	81.73	8500	0.2990	0.2933
0.4387	86.54	9000	0.2834	0.2755
0.4511	91.34	9500	0.2886	0.2787
0.4112	96.15	10000	0.3093	0.2976
0.4064	100.96	10500	0.3123	0.2863
0.4047	105.77	11000	0.2968	0.2719
0.3519	110.57	11500	0.3106	0.2832
0.3719	115.38	12000	0.3030	0.2737
0.3669	120.19	12500	0.2964	0.2714
0.3386	125.0	13000	0.3101	0.2714
0.3137	129.8	13500	0.3063	0.2710
0.3008	134.61	14000	0.3082	0.2617
0.301	139.42	14500	0.3121	0.2628
0.3291	144.23	15000	0.3105	0.2612
0.3133	149.04	15500	0.3114	0.2624