H

Hubert Xlarge Ll60k

由 facebook 开发
Hubert是一个基于自监督学习的语音表征模型,通过类BERT的预测损失学习语音的声学和语言联合表征。
下载量 3,874
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于16kHz采样的语音音频进行预训练,适用于多种下游语音任务,如自动语音识别、说话人识别等。

模型特点

自监督学习
通过类BERT的预测损失学习语音表征,无需大量标注数据。
多轮聚类迭代
采用两轮聚类迭代优化模型性能,提升表征质量。
联合表征学习
同时学习声学和语言模型的联合表征,提升下游任务表现。

模型能力

语音表征提取
自动语音识别
说话人识别
意图分类
情感识别

使用案例

语音处理
自动语音识别
将语音转换为文本
在Librispeech和Libri-light基准测试中达到或超越wav2vec 2.0的性能
说话人识别
识别语音中的说话人身份