C

Convtasnet Libri3Mix Sepnoisy 16k

由 JorisCos 开发
基于Asteroid框架训练的ConvTasNet模型,用于从混合音频中分离噪声和语音信号。
下载量 473
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型使用Libri3Mix数据集在分离噪声任务上进行训练,能够从包含多个说话者和背景噪声的混合音频中分离出清晰的语音信号。

模型特点

高效的音频分离
使用ConvTasNet架构,能够高效地从混合音频中分离出多个说话者的语音信号。
噪声抑制
专门针对包含背景噪声的混合音频进行训练,能够有效抑制噪声。
高采样率支持
支持16kHz的音频采样率,适用于高质量的音频处理需求。

模型能力

音频分离
噪声抑制
多说话者分离

使用案例

语音增强
会议录音增强
从包含多个说话者和背景噪声的会议录音中分离出清晰的语音信号。
SI-SDR改进10.28dB,SIR改进18.57dB
音频后期处理
影视音频处理
从影视录音中分离出清晰的对话信号,去除背景噪声。
STOI改进0.207,语音清晰度显著提升