ConvTasNet_Libri3Mix_sepnoisy开源模型 - 免费部署实现含噪音频分离

首页

Convtasnet Libri3Mix Sepnoisy

由 mpariente 开发

基于Asteroid框架训练的ConvTasNet模型，用于含噪音频分离任务，训练数据来自Libri3Mix数据集。

声音分离

PyTorch

#多说话人分离 #含噪音频处理 #低采样率优化

下载量 30

发布时间 : 3/2/2022

模型简介

该模型专为含噪环境下的多说话人语音分离任务设计，能够从混合音频中分离出清晰的单说话人语音。

模型特点

高效的音频分离

采用ConvTasNet架构，能够有效处理含噪环境下的多说话人语音分离任务。

优化的训练配置

使用精心设计的滤波器组和掩码网络配置，提升分离性能。

全面的性能指标

提供SI-SDR、SDR、SIR、SAR和STOI等多种评估指标，全面衡量模型性能。

模型能力

多说话人语音分离

含噪音频处理

音频增强

使用案例

语音处理

会议记录增强

从多人会议录音中分离出清晰的单人语音，提升语音识别准确率。

SI-SDR提升11.23，STOI提升0.22

语音通信降噪

在嘈杂环境中分离出目标说话人语音，提高通信质量。

SIR提升19.53

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Convtasnet Libri3Mix Sepnoisy

模型简介

模型特点

模型能力

使用案例

🚀 Asteroid模型

🚀 快速开始

✨ 主要特性

📚 详细文档

训练配置

训练结果

📄 许可证