S

Sepformer Libri3mix

由 speechbrain 开发
这是一个基于SepFormer架构的音频源分离模型,在Libri3Mix数据集上训练,能够将混合语音分离为多个独立音源。
下载量 1,511
发布时间 : 9/16/2022
模型介绍
内容详情
替代品

模型简介

该模型使用SepFormer架构实现音频源分离功能,专门针对混合语音场景设计,能够从混合音频中分离出独立的语音源。

模型特点

高性能分离能力
在Libri3Mix测试集上达到19.8 dB SI-SNRi的分离性能
基于Transformer架构
采用先进的SepFormer架构,利用自注意力机制实现高效分离
多说话人分离
能够同时分离混合音频中的多个说话人声音

模型能力

音频源分离
多说话人语音分离
8kHz音频处理

使用案例

语音处理
会议录音分离
将多人会议录音分离为独立的说话人音频
可清晰分离3个同时说话的语音源
语音增强
从背景噪音中提取清晰语音
提高语音识别准确率