S

Sew D Tiny 100k

由 asapp 开发
SEW-D是由ASAPP Research开发的压缩高效型语音预训练模型,基于16kHz采样的语音音频进行预训练,适用于多种下游语音任务。
下载量 1,074
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

SEW-D是一种高效的语音预训练模型,专为自动语音识别等任务设计,通过优化架构实现性能与效率的双重提升。

模型特点

高效推理
相比wav2vec 2.0实现了1.9倍的推理加速。
性能提升
在相近推理耗时下,词错误率降低25%-50%。
优化架构
通过系统化分析架构设计,实现性能与效率的双重提升。

模型能力

语音识别
说话人识别
意图分类
情感识别

使用案例

语音处理
自动语音识别
将语音转换为文本
在LibriSpeech数据集上词错误率相对降低13.5%
说话人识别
识别不同说话人的身份