S

Sepformer Dns4 16k Enhancement

由 speechbrain 开发
这是一个基于SepFormer架构的语音增强模型,专门用于去噪任务,在微软DNS-4数据集上训练,支持16kHz采样频率的音频处理。
下载量 1,669
发布时间 : 8/6/2023
模型介绍
内容详情
替代品

模型简介

该模型使用SepFormer架构实现语音增强功能,主要用于去除音频中的背景噪声,提高语音质量。模型在1300小时的微软DNS 4数据集上训练,适用于16kHz采样频率的音频。

模型特点

高性能去噪
在DNS4 2022基线开发集上表现出色,DNSMOS SIG得分2.999,BAK得分3.076,OVRL得分2.437
多语言支持
支持包括英文、德文、俄文、法文、意大利文和西班牙文在内的多种语言
基于Transformer架构
采用先进的SepFormer架构,结合Transformer的优势进行语音分离和增强

模型能力

音频去噪
语音质量增强
背景噪声抑制

使用案例

语音通信
VoIP通话增强
提高网络语音通话质量,减少背景噪声干扰
显著改善通话清晰度
音频后期处理
录音去噪
对现场录音进行降噪处理,提高语音可懂度
提升录音质量,使语音更清晰