W

Wangyou Zhang Chime4 Enh Train Enh Conv Tasnet Raw

由 espnet 开发
基于ESPnet框架训练的语音增强模型,使用chime4数据集进行训练,适用于单通道语音增强任务。
下载量 57
发布时间 : 4/11/2022
模型介绍
内容详情
替代品

模型简介

该模型采用Conv-TasNet架构,专门用于语音增强任务,能够从含噪声的混合语音中分离出清晰的语音信号。

模型特点

基于Conv-TasNet架构
采用时间卷积网络(Temporal Convolutional Network)进行语音分离,具有高效的特征提取能力。
端到端训练
直接从原始音频学习到目标语音的映射,无需复杂的特征工程。
SI-SNR优化目标
使用尺度不变信噪比(SI-SNR)作为损失函数,优化语音质量。

模型能力

单通道语音增强
噪声抑制
语音分离

使用案例

语音处理
会议语音增强
在嘈杂的会议环境中提取清晰的语音信号
提高语音识别准确率和可懂度
电话语音增强
改善移动通信中的语音质量
提升通话体验