许可证:apache-2.0
标签:
- 训练生成
数据集:
- 音频文件夹
评估指标:
- 准确率
- F1分数
- 召回率
- 精确率
模型索引:
- 名称:wav2vec2-base-Toronto_emotional_speech_set
结果:[]
语言:
- 英语
管道标签:音频分类
wav2vec2-base-Toronto_emotional_speech_set
该模型是基于facebook/wav2vec2-base在音频文件夹数据集上微调的版本。在评估集上取得了以下结果:
- 损失:0.4925
- 准确率:0.8804
- 加权F1分数:0.8837
- 微平均F1分数:0.8804
- 宏平均F1分数:0.8822
- 加权召回率:0.8804
- 微平均召回率:0.8804
- 宏平均召回率:0.8757
- 加权精确率:0.9044
- 微平均精确率:0.8804
- 宏平均精确率:0.9059
模型描述
该模型用于对音频样本中说话者的情绪进行分类。
关于其创建过程的更多信息,请查看以下链接:
https://github.com/DunnBC22/Vision_Audio_and_Multimodal_Projects/blob/main/Audio-Projects/Emotion%20Detection/Toronto%20Emotional%20Speech%20Set%20(TESS)/Toronto%20Emotional%20Speech%20Set%20(TESS).ipynb
预期用途与限制
该模型旨在展示我利用技术解决复杂问题的能力。
训练与评估数据
数据集来源:https://www.kaggle.com/datasets/ejlok1/toronto-emotional-speech-set-tess
训练过程
训练超参数
训练过程中使用的超参数如下:
- 学习率:3e-05
- 训练批次大小:32
- 评估批次大小:32
- 随机种子:42
- 梯度累积步数:4
- 总训练批次大小:128
- 优化器:Adam(beta1=0.9,beta2=0.999,epsilon=1e-08)
- 学习率调度器类型:线性
- 学习率预热比例:0.1
- 训练轮数:15
训练结果
训练损失 |
轮次 |
步数 |
验证损失 |
准确率 |
加权F1 |
微平均F1 |
宏平均F1 |
加权召回率 |
微平均召回率 |
宏平均召回率 |
加权精确率 |
微平均精确率 |
宏平均精确率 |
1.9517 |
0.97 |
17 |
1.9432 |
0.2411 |
0.1338 |
0.2411 |
0.1201 |
0.2411 |
0.2411 |
0.2168 |
0.1161 |
0.2411 |
0.1049 |
1.9517 |
2.0 |
35 |
1.9036 |
0.3375 |
0.3037 |
0.3375 |
0.3082 |
0.3375 |
0.3375 |
0.3533 |
0.5364 |
0.3375 |
0.5379 |
1.9517 |
2.97 |
52 |
1.6629 |
0.4518 |
0.4020 |
0.4518 |
0.3936 |
0.4518 |
0.4518 |
0.4503 |
0.6751 |
0.4518 |
0.6555 |
1.9517 |
4.0 |
70 |
1.2026 |
0.7357 |
0.7121 |
0.7357 |
0.6989 |
0.7357 |
0.7357 |
0.7240 |
0.7903 |
0.7357 |
0.7848 |
1.9517 |
4.97 |
87 |
0.8458 |
0.8839 |
0.8796 |
0.8839 |
0.8767 |
0.8839 |
0.8839 |
0.8845 |
0.8874 |
0.8839 |
0.8807 |
1.9517 |
6.0 |
105 |
0.6493 |
0.8946 |
0.8939 |
0.8946 |
0.8914 |
0.8946 |
0.8946 |
0.8937 |
0.9049 |
0.8946 |
0.9014 |
1.9517 |
6.97 |
122 |
0.5149 |
0.9089 |
0.9046 |
0.9089 |
0.8989 |
0.9089 |
0.9089 |
0.8957 |
0.9275 |
0.9089 |
0.9327 |
1.9517 |
8.0 |
140 |
0.3814 |
0.9536 |
0.9531 |
0.9536 |
0.9501 |
0.9536 |
0.9536 |
0.9474 |
0.9577 |
0.9536 |
0.9583 |
1.9517 |
8.97 |
157 |
0.5627 |
0.85 |
0.8459 |
0.85 |
0.8402 |
0.85 |
0.85 |
0.8378 |
0.9100 |
0.85 |
0.9160 |
1.9517 |
10.0 |
175 |
0.4702 |
0.8911 |
0.8861 |
0.8911 |
0.8854 |
0.8911 |
0.8911 |
0.8938 |
0.9021 |
0.8911 |
0.8967 |
1.9517 |
10.97 |
192 |
0.3362 |
0.9393 |
0.9376 |
0.9393 |
0.9361 |
0.9393 |
0.9393 |
0.9399 |
0.9402 |
0.9393 |
0.9365 |
1.9517 |
12.0 |
210 |
0.3808 |
0.9179 |
0.9181 |
0.9179 |
0.9176 |
0.9179 |
0.9179 |
0.9180 |
0.9251 |
0.9179 |
0.9235 |
1.9517 |
12.97 |
227 |
0.4546 |
0.9036 |
0.9045 |
0.9036 |
0.9024 |
0.9036 |
0.9036 |
0.8988 |
0.9151 |
0.9036 |
0.9157 |
1.9517 |
14.0 |
245 |
0.5065 |
0.8786 |
0.8826 |
0.8786 |
0.8813 |
0.8786 |
0.8786 |
0.8742 |
0.9040 |
0.8786 |
0.9055 |
1.9517 |
14.57 |
255 |
0.4925 |
0.8804 |
0.8837 |
0.8804 |
0.8822 |
0.8804 |
0.8804 |
0.8757 |
0.9044 |
0.8804 |
0.9059 |
框架版本
- Transformers 4.27.4
- PyTorch 2.0.0
- Datasets 2.11.0
- Tokenizers 0.13.3