W

Wav2vec2 Large Xlsr 53 842h Luxembourgish 4h

由 Lemswasabi 开发
基于842小时未标注和4小时标注卢森堡语音数据微调的自动语音识别模型
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于wav2vec 2.0 large XLSR-53架构的卢森堡语语音识别模型,先在842小时未标注数据上预训练,再在4小时标注数据上微调。

模型特点

跨语言语音表征
利用XLSR-53的多语言预训练模型作为基础,有效处理资源匮乏的卢森堡语
高效数据利用
仅使用4小时标注数据就实现了较好的识别效果
双阶段训练
先在大规模未标注数据上预训练,再在小规模标注数据上微调

模型能力

卢森堡语语音识别
语音转文本

使用案例

语音转录
卢森堡语媒体内容转录
将卢森堡语的广播、电视节目自动转录为文本
词错误率18.77%
语音助手
卢森堡语语音交互
为卢森堡地区开发本地化语音助手