D

Dcunet Libri1Mix Enhsingle 16k

由 JorisCos 开发
基于Asteroid框架训练的音频增强模型,专门用于单声道语音增强任务
下载量 69
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型采用DCUNet-20架构,在Libri1Mix数据集上训练,用于提升单声道音频质量,特别适用于语音增强场景

模型特点

高性能语音增强
在Libri1Mix测试集上实现了13.15dB的SI-SDR提升和0.92的STOI评分
深度复数U-Net架构
采用20层DCUNet结构,专门设计用于处理复数频谱的音频信号
固定长度处理
支持填充模式的固定长度音频处理,适合批量处理

模型能力

单声道语音增强
音频质量提升
噪声抑制

使用案例

语音处理
通话质量增强
提升语音通话中的语音清晰度和可懂度
SI-SDR提升9.7dB,STOI提升12.4%
语音识别预处理
作为ASR系统的前端处理模块,提高识别准确率