S

Sepformer Wham Enhancement

由 speechbrain 开发
使用SepFormer模型进行语音增强(去噪)的工具集,在WHAM!数据集(8kHz采样频率版本)上预训练,实现环境噪声和混响的去除。
下载量 827
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于SepFormer架构,专门用于语音增强任务,能够有效去除音频中的环境噪声和混响效果,提升语音清晰度。

模型特点

高效的语音去噪
能够有效去除音频中的环境噪声和混响,提升语音清晰度。
基于Transformer的架构
采用SepFormer架构,利用自注意力机制实现高效的语音分离和增强。
预训练模型
在WHAM!数据集上预训练,可直接用于语音增强任务,无需额外训练。

模型能力

语音去噪
语音增强
音频处理

使用案例

语音处理
语音增强
去除录音中的环境噪声和混响,提升语音清晰度。
SI-SNR提升至14.35 dB,PESQ达到3.07。