C

Convtasnet Libri2Mix Sepnoisy 8k

由 JorisCos 开发
基于Asteroid框架训练的ConvTasNet模型,用于8kHz采样率下的语音分离任务,特别针对含噪声的混合语音场景。
下载量 31
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型采用ConvTasNet架构,在Libri2Mix数据集的'sep_noisy'任务上进行训练,能够从含噪声的混合音频中分离出清晰的语音信号。

模型特点

噪声鲁棒性
专门针对含噪声的混合语音进行优化,能有效分离背景噪声和语音信号
轻量级架构
采用ConvTasNet架构,在保持较高分离性能的同时具有较低计算复杂度
8kHz优化
专门针对8kHz采样率的音频进行优化,适用于电话语音等低带宽场景

模型能力

语音分离
噪声抑制
音频增强

使用案例

语音通信
电话语音增强
提升嘈杂环境中电话通话的语音清晰度
SI-SDR提升11.94dB,STOI提升0.207
音频后期处理
录音去噪
从含环境噪声的录音中分离纯净语音
SIR提升22.46dB,SAR提升4.25dB