标签:
- 音频转音频
- 小行星
- 音频
- 音频源分离
数据集:
- wham
- sep_clean
许可证: cc-by-sa-4.0
小行星模型 mpariente/DPRNNTasNet(ks=16)_WHAM!_sepclean
♻️ 从 https://zenodo.org/record/3903795#.X8pMBRNKjUI 导入
该模型由 Manuel Pariente 使用 Asteroid 中的 wham/DPRNN 配方训练而成。它是在 WHAM! 数据集的 sep_clean 任务上进行训练的。
演示:如何在 Asteroid 中使用
训练配置
- 数据:
- 模式: 最小
- 非默认源数: 无
- 采样率: 8000
- 片段: 2.0
- 任务: sep_clean
- 训练目录: data/wav8k/min/tr
- 验证目录: data/wav8k/min/cv
- 滤波器组:
- 主要参数:
- 实验目录: exp/train_dprnn_ks16/
- 帮助: 无
- 掩码网络:
- 双向: 是
- 通道数: 128
- 块大小: 100
- 丢弃率: 0
- 隐藏大小: 128
- 跳跃大小: 50
- 输入通道: 64
- 掩码激活函数: sigmoid
- 重复次数: 6
- 源数: 2
- 输出通道: 64
- 优化:
- 学习率: 0.001
- 优化器: adam
- 权重衰减: 1e-05
- 位置参数:
- 训练:
- 批次大小: 6
- 早停: 是
- 周期数: 200
- 梯度裁剪: 5
- 半学习率: 是
- 工作线程数: 6
结果
si_sdr
: 18.227683982688003
si_sdr_imp
: 18.22883576588251
sdr
: 18.617789605060587
sdr_imp
: 18.466745426438173
sir
: 29.22773720052717
sir_imp
: 29.07669302190474
sar
: 19.116352171914485
sar_imp
: -130.06009796503054
stoi
: 0.9722025377865715
stoi_imp
: 0.23415680987800583
引用 Asteroid
@inproceedings{Pariente2020Asteroid,
title={Asteroid: the {PyTorch}-based audio source separation toolkit for researchers},
author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and
Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and
Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge
and Emmanuel Vincent},
year={2020},
booktitle={Proc. Interspeech},
}
或在 arXiv 上:
@misc{pariente2020asteroid,
title={Asteroid: the PyTorch-based audio source separation toolkit for researchers},
author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge and Emmanuel Vincent},
year={2020},
eprint={2005.04132},
archivePrefix={arXiv},
primaryClass={eess.AS}
}