C

Convtasnet Libri2Mix Sepnoisy 16k

由 JorisCos 开发
基于Asteroid框架训练的ConvTasNet模型,用于含噪语音分离任务,在Libri2Mix数据集上训练。
下载量 8,407
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型采用ConvTasNet架构,专门用于从含噪混合音频中分离出清晰的语音信号,适用于语音增强和分离任务。

模型特点

高效语音分离
能够在含噪环境下有效分离语音信号,提升语音清晰度。
优化的ConvTasNet架构
采用8个块和3次重复的掩码网络结构,结合跳跃连接,优化分离效果。
高质量训练数据
基于Libri2Mix和WSJ0 Hipster Ambient Mixtures数据集训练,确保模型泛化能力。

模型能力

含噪语音分离
语音增强
多说话人分离

使用案例

语音处理
语音增强
在嘈杂环境中提取清晰语音信号,适用于语音识别预处理。
SI-SDR提升12.55dB,STOI提升0.224
会议记录
分离会议录音中的不同说话人语音,提高转录准确性。
SIR提升24.37dB