R

Resepformer Wsj02mix

由 speechbrain 开发
这是一个基于RE-SepFormer架构的音频源分离模型,由SpeechBrain实现并在WSJ0-2Mix数据集上训练。
下载量 488
发布时间 : 6/19/2022
模型介绍
内容详情
替代品

模型简介

该模型用于音频源分离任务,能够将混合音频中的不同声源分离出来。

模型特点

高效分离
采用RE-SepFormer架构,实现了资源高效的音频源分离
高性能
在WSJ0-2Mix测试集上达到18.6 dB的SI-SNRi性能
易于使用
提供简单的Python接口,便于集成到现有系统中

模型能力

音频源分离
语音信号处理

使用案例

音频处理
语音分离
从混合音频中分离出不同的说话人声音
SI-SNRi 18.6 dB, SDRi 18.9 dB
音频增强
从背景噪声中提取目标语音信号