S

Sepformer Whamr Enhancement

由 speechbrain 开发
该模型通过SepFormer架构实现语音增强(去噪+去混响),在WHAMR!数据集(8kHz)上预训练,测试集SI-SNR达10.59dB。
下载量 570
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于Transformer的语音增强模型,专门用于处理含环境噪声和混响的语音信号,可同时进行去噪和去混响处理。

模型特点

双任务处理
可同时处理语音去噪和去混响两个任务
Transformer架构
采用SepFormer架构,利用注意力机制实现高效语音分离
低采样率优化
专门针对8kHz采样率的语音信号优化

模型能力

语音去噪
语音去混响
音频质量增强

使用案例

语音处理
通话质量增强
提升嘈杂环境下的语音通话清晰度
SI-SNR提升10.59dB,PESQ达2.84
会议录音增强
改善会议室等混响严重场景的录音质量