C

Convtasnet Libri3Mix Sepnoisy 8k

由 JorisCos 开发
基于Asteroid框架训练的ConvTasNet模型,用于从混合音频中分离出3个独立音源,特别针对8kHz采样率的含噪声语音数据优化。
下载量 33
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型采用ConvTasNet架构,专门设计用于音频源分离任务,能够从混合音频中分离出3个独立的语音源,尤其适用于含噪声环境下的语音分离。

模型特点

多源语音分离
能够同时分离混合音频中的3个独立语音源
噪声鲁棒性
专门针对含噪声环境下的语音分离进行优化
轻量级架构
采用高效的ConvTasNet架构,适合实时处理

模型能力

音频源分离
噪声抑制
多说话人分离

使用案例

语音处理
会议记录增强
从多人同时说话的录音中分离出单个说话人的清晰语音
可提升语音识别准确率
音频后期制作
从混合音轨中提取特定说话人的声音
便于重新混音或编辑
辅助技术
助听设备
在嘈杂环境中分离目标说话人语音
改善听力障碍用户的听觉体验