V

Voiceguard

由 Mrkomiljon 开发
基于Wav2Vec2微调的音频分类器,能够区分真人语音和AI生成语音。
下载量 127
发布时间 : 12/2/2024
模型介绍
内容详情
替代品

模型简介

该模型用于检测音频是否为AI生成,可识别多种TTS模型生成的语音,适用于语音安全验证场景。

模型特点

高准确率分类
测试集验证准确率达99.8%,能有效区分真人语音与多种AI生成语音
多模型兼容
支持识别Melgan、DiffWave等多种TTS模型生成的语音
轻量级部署
基于Wav2Vec2-base架构,适合实时推理场景

模型能力

音频分类
AI生成语音检测
语音真实性验证

使用案例

安全验证
语音钓鱼防护
检测可疑电话中的AI合成语音
可识别99%以上的已知TTS模型生成语音
内容审核
虚假音频识别
识别社交媒体中的AI生成语音内容