C

Convtasnet Libri3Mix Sepnoisy

由 mpariente 开发
基于Asteroid框架训练的ConvTasNet模型,用于含噪音频分离任务,训练数据来自Libri3Mix数据集。
下载量 30
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专为含噪环境下的多说话人语音分离任务设计,能够从混合音频中分离出清晰的单说话人语音。

模型特点

高效的音频分离
采用ConvTasNet架构,能够有效处理含噪环境下的多说话人语音分离任务。
优化的训练配置
使用精心设计的滤波器组和掩码网络配置,提升分离性能。
全面的性能指标
提供SI-SDR、SDR、SIR、SAR和STOI等多种评估指标,全面衡量模型性能。

模型能力

多说话人语音分离
含噪音频处理
音频增强

使用案例

语音处理
会议记录增强
从多人会议录音中分离出清晰的单人语音,提升语音识别准确率。
SI-SDR提升11.23,STOI提升0.22
语音通信降噪
在嘈杂环境中分离出目标说话人语音,提高通信质量。
SIR提升19.53