S

Sew D Tiny 100k Ft Ls100h

由 asapp 开发
SEW-D-tiny 是由 ASAPP Research 开发的高效语音识别预训练模型,专注于性能和效率的平衡。
下载量 24.55k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型在16kHz采样的语音音频上进行了预训练,适用于自动语音识别、说话人识别、意图分类等下游任务。

模型特点

高效推理
相比wav2vec 2.0实现了1.9倍的推理加速。
性能提升
在LibriSpeech的100h-960h半监督设置下,词错误率相对降低了13.5%。
轻量级
模型设计注重效率,适合资源受限的环境。

模型能力

语音识别
说话人识别
意图分类
情感识别

使用案例

语音转文本
LibriSpeech 语音转录
将LibriSpeech数据集中的语音转换为文本。
在LibriSpeech clean测试集上WER为10.47,other测试集上WER为22.73。