S

Sepformer Wsj03mix

由 speechbrain 开发
这是一个使用SepFormer架构进行音频源分离的模型,在WSJ0-3Mix数据集上训练,能够将混合语音分离成独立的语音源。
下载量 158
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于Transformer架构的SepFormer实现,专门用于音频源分离任务,能够从混合音频中分离出多个独立的语音信号。

模型特点

高性能分离
在WSJ0-3Mix测试集上达到19.8 dB SI-SNRi和20.0 dB SDRi的分离性能
基于Transformer架构
采用先进的SepFormer架构,利用注意力机制实现高效语音分离
即用型模型
提供简单易用的接口,可直接对音频文件进行分离处理

模型能力

语音分离
多说话人分离
音频源分离

使用案例

语音处理
会议录音分离
从多人同时说话的会议录音中分离出各个说话人的独立语音
可清晰分离3个同时说话的语音源
音频增强
从嘈杂的混合音频中提取目标语音信号
提高语音清晰度和可懂度