S

Sew Tiny 100k Ft Ls100h

由 asapp 开发
SEW(压缩高效版Wav2vec)是由ASAPP Research开发的语音识别预训练模型,在性能和效率上优于wav2vec 2.0
下载量 736
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于16kHz采样语音音频预训练的语音识别模型,需在下游任务上微调使用

模型特点

高效性能
相比wav2vec 2.0实现1.9倍推理加速,词错误率降低13.5%
压缩架构
优化的模型架构在保持性能的同时减少计算资源需求
多任务适配
可通过微调应用于ASR、说话人识别、意图分类等多种语音任务

模型能力

语音识别
语音转文本
音频特征提取

使用案例

语音转录
LibriSpeech语音转录
将英文有声读物内容转录为文本
在LibriSpeech clean测试集上WER 10.61,other测试集上WER 23.74
语音应用开发
语音助手
作为语音助手的语音识别组件