C

Convtasnet Libri2Mix Sepclean 8k

由 JorisCos 开发
基于Asteroid框架训练的ConvTasNet模型,用于8kHz采样率的语音分离任务,在Libri2Mix数据集上训练。
下载量 179
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型用于从混合音频中分离出干净的语音信号,特别适用于双说话人场景。

模型特点

高效的语音分离
能够在8kHz采样率下有效分离混合语音中的说话人
优化的ConvTasNet架构
使用8个块和3次重复的深度网络结构,具有128个跳跃连接通道
轻量级训练
使用24的批次大小和3秒的音频片段长度进行高效训练

模型能力

双说话人语音分离
音频信号增强
语音信号处理

使用案例

语音处理
会议记录分离
从多人会议录音中分离出单个说话人的语音
SI-SDR提升14.76dB
语音增强
从背景噪声或其他说话人中提取目标语音
STOI提升0.218