A

AST VoxCelebSpoof Synthetic Voice Detection

由 MattyB95 开发
基于MIT/ast-finetuned-audioset-10-10-0.4593微调的合成语音检测模型,在VoxCelebSpoof数据集上表现出色
下载量 9,518
发布时间 : 1/16/2024
模型介绍
内容详情
替代品

模型简介

该模型用于检测合成语音,基于AST架构在音频分类任务上进行微调,特别针对语音欺骗检测场景优化

模型特点

高准确率
在评估集上达到99.99%的准确率和F1值
基于AST架构
采用Audio Spectrogram Transformer架构,擅长处理音频频谱特征
专门针对合成语音检测
针对VoxCelebSpoof数据集优化,特别适合语音欺骗检测场景

模型能力

音频分类
合成语音检测
语音欺骗识别

使用案例

安全验证
语音认证系统
用于检测语音认证系统中的合成语音攻击
可有效识别99.99%的合成语音样本
内容审核
虚假音频检测
识别社交媒体上的AI生成虚假音频内容