W

Wav2vec2 Large Xlsr 53 842h Luxembourgish 14h With Lm

由 Lemswasabi 开发
基于wav2vec 2.0大型XLSR-53检查点微调的卢森堡语语音识别模型,使用842小时未标注和14小时标注数据训练,并集成5-gram语言模型
下载量 170
发布时间 : 5/24/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个针对卢森堡语的自动语音识别系统,通过大规模未标注数据和少量标注数据训练,结合语言模型提升识别准确率

模型特点

跨语言预训练
基于XLSR-53多语言模型进行微调,充分利用跨语言语音表征
语言模型集成
使用5-gram语言模型对输出进行重新评分,提高识别准确率
高效数据利用
结合842小时未标注数据和14小时标注数据进行训练

模型能力

卢森堡语语音识别
音频转文本
语音转录

使用案例

媒体转录
广播内容转录
转录RTL.lu等卢森堡语广播内容
词错误率9.3%-9.5%
语音助手
卢森堡语语音交互
为卢森堡语用户提供语音控制功能