许可协议:apache-2.0
基础模型:motheecreator/Deepfake-audio-detection
标签:
- 训练生成
数据集:
- 音频文件夹
评估指标:
- 准确率
- 精确率
- 召回率
- F1值
模型索引:
- 名称:Deepfake-audio-detection
结果:
- 任务:
名称:音频分类
类型:音频分类
数据集:
名称:音频文件夹
类型:音频文件夹
配置:默认
分割:训练集
参数:默认
评估指标:
- 名称:准确率
类型:准确率
值:0.9963791074499864
- 名称:精确率
类型:精确率
值:0.9943959123125103
- 名称:召回率
类型:召回率
值:0.9990064580228515
- 名称:F1值
类型:F1值
值:0.9966958532958864
Deepfake音频检测模型
本模型是基于音频文件夹数据集对motheecreator/Deepfake-audio-detection进行微调的版本。在评估集上取得如下结果:
- 损失值:0.0192
- 准确率:0.9964
- 精确率:0.9944
- 召回率:0.9990
- F1值:0.9967
- ROC曲线下面积:1.0000
- 混淆矩阵:[[4974, 34], [6, 6033]]
- 分类报告:
'0'类:{'精确率': 0.9988, '召回率': 0.9932, 'f1分数': 0.9960, '支持数': 5008}
'1'类:{'精确率': 0.9944, '召回率': 0.9990, 'f1分数': 0.9967, '支持数': 6039}
整体准确率:0.9964
宏平均:{'精确率': 0.9966, '召回率': 0.9961, 'f1分数': 0.9963}
加权平均:{'精确率': 0.9964, '召回率': 0.9964, 'f1分数': 0.9964}
模型描述
(需补充详细信息)
用途与限制
(需补充详细信息)
训练与评估数据
(需补充详细信息)
训练过程
训练超参数
- 学习率:3e-05
- 训练批次大小:16
- 评估批次大小:16
- 随机种子:42
- 梯度累积步数:2
- 总训练批次大小:32
- 优化器:Adam(beta1=0.9,beta2=0.999,epsilon=1e-08)
- 学习率调度器类型:余弦退火
- 学习率预热比例:0.1
- 训练轮次:2
- 混合精度训练:原生AMP
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
准确率 |
精确率 |
召回率 |
F1值 |
ROC面积 |
混淆矩阵 |
分类报告(简略) |
0.1006 |
0.3621 |
1000 |
0.1897 |
0.9651 |
0.9424 |
0.9972 |
0.9690 |
0.9989 |
[[4640,368],[17,6022]] |
'0'类F1:0.9602, '1'类F1:0.9690, 准确率:0.9651 |
0.0700 |
0.7241 |
2000 |
0.0333 |
0.9916 |
0.9914 |
0.9932 |
0.9923 |
0.9997 |
[[4956,52],[41,5998]] |
'0'类F1:0.9907, '1'类F1:0.9923, 准确率:0.9916 |
0.0160 |
1.0862 |
3000 |
0.1018 |
0.9841 |
0.9727 |
0.9988 |
0.9856 |
0.9998 |
[[4839,169],[7,6032]] |
'0'类F1:0.9821, '1'类F1:0.9856, 准确率:0.9841 |
0.0209 |
1.4482 |
4000 |
0.0212 |
0.9957 |
0.9950 |
0.9972 |
0.9961 |
0.9999 |
[[4978,30],[17,6022]] |
'0'类F1:0.9953, '1'类F1:0.9961, 准确率:0.9957 |
0.0233 |
1.8103 |
5000 |
0.0192 |
0.9964 |
0.9944 |
0.9990 |
0.9967 |
1.0000 |
[[4974,34],[6,6033]] |
'0'类F1:0.9960, '1'类F1:0.9967, 准确率:0.9964 |
框架版本
- Transformers 4.41.1
- PyTorch 2.1.2
- Datasets 2.19.1
- Tokenizers 0.19.1