W

Wsj0 2mix Skim Small Causal

由 lichenda 开发
这是一个基于ESPnet框架训练的语音增强模型,专门用于处理wsj0_2mix数据集中的混合语音信号分离任务。
下载量 26
发布时间 : 5/17/2023
模型介绍
内容详情
替代品

模型简介

该模型采用skim架构,具有因果性处理能力,适用于实时语音增强场景,能够有效分离混合语音中的不同说话人信号。

模型特点

因果处理能力
模型采用因果结构设计,适合实时语音处理应用场景
轻量级架构
小型skim架构设计,在保持性能的同时降低计算复杂度
多说话人分离
能够有效分离混合语音中的两个说话人信号

模型能力

语音增强
说话人分离
实时语音处理

使用案例

语音通信
会议语音增强
在多人会议场景中分离不同说话人的声音
STOI指标达到94.20,SDR指标14.33
语音识别预处理
ASR前端处理
为语音识别系统提供更干净的输入信号
可提升语音识别系统在嘈杂环境中的准确率