H

Humaware VAD

由 CuriousMonkey7 开发
基于Silero-VAD微调的哼唱感知语音活动检测模型,专门用于区分哼唱与真实语音
下载量 434
发布时间 : 3/6/2025
模型介绍
内容详情
替代品

模型简介

HumAware-VAD通过使用自定义数据集微调Silero-VAD模型,提升在哼唱存在时的语音检测准确率,减少哼唱被误判为语音的情况。

模型特点

哼唱感知
专门针对哼唱与真实语音的区分进行优化,减少假阳性
实时推理
保持Silero-VAD的实时推理能力
抗噪声优化
在混合音频中更准确地分割语音,提升抗噪声能力

模型能力

语音活动检测
哼唱识别
音频分割

使用案例

语音处理
自动语音识别预处理
在ASR系统中更准确地分割语音片段
减少哼唱导致的误识别
语音通信过滤
在通话或语音通信中过滤非语音内容
提高通话质量
音频分析
音乐与人声分离
在混合音频中区分人声与背景音乐
更准确的音频成分分析