H

Hubert Xlarge Ls960 Ft

由 facebook 开发
基于Librispeech 960小时语音数据微调的Hubert超大规模语音识别模型,在LibriSpeech测试集上WER仅为1.8
下载量 8,160
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是Facebook开发的Hubert自监督语音表征学习模型的微调版本,专门用于英语自动语音识别任务。

模型特点

自监督学习
采用HuBERT自监督学习方法,通过离线聚类步骤提供BERT式预测损失目标
高性能
在LibriSpeech clean测试集上WER仅为1.8,性能优异
大规模训练
基于Librispeech 960小时语音数据进行微调

模型能力

英语语音识别
16kHz采样率音频处理

使用案例

语音转写
会议记录转写
将英语会议录音自动转写为文字
高准确率的文字转写结果
音频内容索引
为音频内容创建可搜索的文字索引
提升音频内容的可检索性