W

Wav2vec2 Large Xlsr 53 842h Luxembourgish 14h

由 Lemswasabi 开发
基于842小时未标注和14小时标注卢森堡语语音数据微调的wav2vec2.0大模型,支持卢森堡语语音识别
下载量 204
发布时间 : 5/21/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Facebook的wav2vec2.0 large XLSR-53架构,针对卢森堡语进行优化的自动语音识别(ASR)模型。先在842小时未标注数据上预训练,再在14小时标注数据上微调,并集成了语言模型。

模型特点

跨语言预训练
基于XLSR-53多语言模型,利用跨语言表征提升卢森堡语识别性能
大规模数据训练
使用842小时未标注和14小时标注卢森堡语数据进行训练
集成语言模型
模型结合了语言模型(LM)以提高识别准确率
低词错误率
在测试集上达到10.71%的WER和2.31%的CER

模型能力

卢森堡语语音识别
音频转文本
自动语音转录

使用案例

媒体转录
广播内容转录
转录RTL.lu等卢森堡语广播内容
语音助手
卢森堡语语音交互
为卢森堡语语音助手提供识别能力