ConvTasNet_WHAM_sepclean开源音频分离模型 - 免费部署精准分离音频

首页

Convtasnet WHAM Sepclean

由 mpariente 开发

这是一个基于Asteroid框架训练的ConvTasNet模型，专门用于音频分离任务，在WHAM!数据集的sep_clean任务上进行训练。

声音分离

PyTorch

#音频分离 #ConvTasNet架构 #WHAM数据集

下载量 302

发布时间 : 3/2/2022

模型简介

该模型主要用于音频到音频的分离任务，能够将混合音频中的不同源分离出来，特别适用于语音分离场景。

模型特点

高效的音频分离

采用ConvTasNet架构，能够高效地从混合音频中分离出不同源

高质量分离效果

在WHAM!数据集上表现出色，SI-SDR指标达到16.21dB

轻量级设计

模型参数经过优化，适合实际应用部署

模型能力

音频分离

语音增强

多源音频处理

使用案例

语音处理

会议录音分离

将多人会议的混合录音分离为单个说话人的独立音频

SI-SDR提升16.21dB，语音清晰度(STOI)达到0.96

音频后期制作

从背景音乐和音效中分离出人声部分

SIR指标达到26.86dB，表明良好的源分离能力

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Convtasnet WHAM Sepclean

模型简介

模型特点

模型能力

使用案例

🚀 Asteroid模型 `mpariente/ConvTasNet_WHAM_sepclean`

🚀 快速开始

✨ 主要特性

📚 详细文档

训练配置

结果

📄 许可证

Convtasnet WHAM Sepclean

模型简介

模型特点

模型能力

使用案例

🚀 Asteroid模型 mpariente/ConvTasNet_WHAM_sepclean

🚀 快速开始

✨ 主要特性

📚 详细文档

训练配置

结果

📄 许可证

🚀 Asteroid模型 `mpariente/ConvTasNet_WHAM_sepclean`