D

Dprnntasnet Ks2 WHAM Sepclean

由 mpariente 开发
基于Asteroid框架训练的语音分离模型,使用WHAM!数据集进行训练,专注于干净语音分离任务。
下载量 512
发布时间 : 3/2/2022

模型简介

该模型采用DPRNN架构,专门用于从混合音频中分离出干净的语音信号,适用于语音增强和分离任务。

模型特点

高效语音分离
采用DPRNN架构,能够有效处理长序列音频信号,实现高质量的语音分离。
低采样率支持
支持8000Hz采样率的音频输入,适用于多种语音处理场景。
轻量级设计
核大小为2,滤波器数量为64的轻量级设计,平衡了性能和计算效率。

模型能力

音频分离
语音增强
多说话人分离

使用案例

语音处理
会议录音分离
从多人会议录音中分离出单个说话人的清晰语音
SI-SDR提升19.32dB
语音增强
从含噪声的录音中提取清晰语音
STOI提升0.24
AIbase
智启未来,您的人工智能解决方案智库
简体中文