U

Unispeech 1350 En 353 Fr Ft 1h

由 microsoft 开发
UniSpeech是一个统一的语音表征学习模型,结合有标注和无标注数据进行预训练,特别针对法语进行了微调。
下载量 20
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于16kHz采样的语音音频和音素标签进行预训练,并在1小时的法语音素数据上进行了微调,主要用于法语自动语音识别任务。

模型特点

统一学习框架
同时进行有监督的音素CTC学习和音素感知的对比自监督学习
跨语言能力
在CommonVoice语料库上展示了良好的跨语言表征学习效果
领域适应性
在领域迁移的语音识别任务中表现优异

模型能力

法语语音识别
音素序列预测
跨语言语音表征学习

使用案例

语音识别
法语语音转音素
将法语语音转换为音素序列
相比自监督预训练和有监督迁移学习,最大可降低13.4%和17.8%的相对音素错误率
语音研究
跨语言语音表征研究
研究不同语言间的语音表征迁移