W

Wav2vec2 Base Toronto Emotional Speech Set

由 DunnBC22 开发
基于wav2vec2-base微调的音频情感分类模型,用于识别说话者的情绪状态。
下载量 185
发布时间 : 5/2/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于facebook/wav2vec2-base在Toronto Emotional Speech Set (TESS)数据集上微调的版本,专门用于对音频样本中说话者的情绪进行分类。

模型特点

高准确率情感识别
在评估集上达到88.04%的准确率,能有效识别多种情绪状态。
基于wav2vec2架构
利用强大的wav2vec2-base模型作为基础,具有良好的音频特征提取能力。
全面评估指标
提供多种评估指标包括F1分数、召回率和精确率,全面反映模型性能。

模型能力

语音情感识别
音频分类
英语语音分析

使用案例

情感分析
客服对话情绪监测
用于分析客服对话中客户的实时情绪状态
可帮助客服人员及时调整沟通策略
心理状态评估
辅助心理医生分析患者的语音情绪特征
提供客观的情绪状态参考指标