S

Sepformer Rescuespeech

由 speechbrain 开发
这是一个基于SepFormer架构的语音增强模型,专门针对救援场景中的德语语音进行去噪处理,在16kHz采样率下表现优异。
下载量 62
发布时间 : 6/30/2023
模型介绍
内容详情
替代品

模型简介

该模型使用SepFormer架构实现语音增强功能,先在Microsoft-DNS 4数据集上预训练,后在救援语音数据集上微调,能有效提升嘈杂环境中的语音质量。

模型特点

救援场景优化
专门针对救援场景中的语音数据进行微调,提升在嘈杂环境中的语音增强效果
高性能架构
采用SepFormer架构,结合Transformer的优势,实现高效的语音分离
多指标优化
在SI-SNR、SI-SDR和PESQ等多个语音质量评估指标上均有显著提升

模型能力

语音去噪
语音增强
救援场景语音处理

使用案例

紧急救援
救援通信增强
在嘈杂的救援环境中提升语音通信质量
PESQ评分提升至2.24,SI-SNR提升7.849dB
语音处理
语音质量改善
对低质量语音进行增强处理
SI-SDR提升8.414dB