T

TIGER DnR

由 JusperLee 开发
TIGER是一款轻量级语音分离模型,通过频带分割和多尺度特征提取实现高效音频处理
下载量 134
发布时间 : 1/22/2025
模型介绍
内容详情
替代品

模型简介

TIGER是一种高效的语音分离模型,采用频带分割和交错建模结构,在保持高性能的同时大幅降低计算成本。主要用于语音分离、降噪和混响消除任务。

模型特点

高效频带分割
通过先验知识划分频带并对频率信息进行压缩,显著降低计算成本
多尺度特征提取
采用多尺度选择性注意力(MSA)模块有效提取上下文特征
轻量级设计
参数数量减少94.3%,MACs降低95.3%,同时保持高性能
真实场景适应
在包含复杂噪声和混响的EchoSet数据集上表现优异

模型能力

语音分离
背景噪声消除
混响消除
多说话人语音分离

使用案例

语音增强
会议录音增强
从多人同时说话的录音中分离出清晰的单人语音
在EchoSet数据集上优于TF-GridNet模型
嘈杂环境语音处理
消除背景噪声和混响,提高语音清晰度
有效处理包含物体遮挡和材料特性影响的真实混响
音频后期制作
影视音频修复
从现场录音中分离和增强目标语音