S

Sepformer Libri2mix

由 speechbrain 开发
使用SepFormer架构实现的音频源分离模型,在Libri2Mix数据集上训练,可分离混合音频中的独立声源
下载量 783
发布时间 : 9/16/2022
模型介绍
内容详情
替代品

模型简介

该模型基于Transformer架构(SepFormer),专门用于音频源分离任务,能够从混合音频中分离出独立的语音信号。

模型特点

高性能分离
在Libri2Mix测试集上达到20.6分贝的SI-SNRi性能
Transformer架构
采用先进的SepFormer架构,利用自注意力机制实现高效分离
易用集成
通过SpeechBrain框架提供简单易用的接口

模型能力

音频源分离
语音信号分离
混合音频处理

使用案例

音频处理
会议录音分离
从多人会议录音中分离出各个发言人的独立音频
可清晰分离不同说话人的声音
音频修复
从背景噪声中提取清晰语音
提高语音清晰度和可懂度