AST-VoxCelebSpoof合成语音检测模型 - 开源免费精准识别合成语音

AST VoxCelebSpoof Synthetic Voice Detection

由 MattyB95 开发

基于MIT/ast-finetuned-audioset-10-10-0.4593微调的合成语音检测模型，在VoxCelebSpoof数据集上表现出色

下载量 9,518

发布时间 : 1/16/2024

模型简介

该模型用于检测合成语音，基于AST架构在音频分类任务上进行微调，特别针对语音欺骗检测场景优化

高准确率

在评估集上达到99.99%的准确率和F1值

基于AST架构

采用Audio Spectrogram Transformer架构，擅长处理音频频谱特征

专门针对合成语音检测

针对VoxCelebSpoof数据集优化，特别适合语音欺骗检测场景

音频分类

合成语音检测

语音欺骗识别

安全验证

语音认证系统

用于检测语音认证系统中的合成语音攻击

可有效识别99.99%的合成语音样本

内容审核

虚假音频检测

识别社交媒体上的AI生成虚假音频内容

训练损失值	轮数	步数	验证损失值	准确率	F1值	精确率	召回率
2218896740319.232	1.0	29527	611463921664.0	0.9998	0.9998	0.9999	0.9997
522149441830.912	2.0	59054	284563668992.0	0.9997	0.9997	0.9999	0.9996
0.0	3.0	88581	89136693248.0	0.9999	0.9999	1.0	0.9998