S

Speech Emotion Recognition With Facebook Wav2vec2 Large Xlsr 53

由 firdhokk 开发
基于Wav2Vec2 Large XLSR-53模型微调的语音情感识别系统,能够识别7种常见情感
下载量 66
发布时间 : 9/20/2024
模型介绍
内容详情
替代品

模型简介

该模型通过微调Wav2Vec2 Large XLSR-53实现语音情感分类,支持愤怒、厌恶、恐惧、快乐、中性、悲伤和惊讶7种情感识别

模型特点

高准确率情感识别
在测试集上达到91.68%的准确率和91.66%的F1值
多数据集训练
融合RAVDESS、SAVEE、TESS和URDU多个数据集进行训练
高效特征提取
使用Wav2Vec2特征提取器处理音频数据,实现标准化特征输入

模型能力

语音情感识别
音频分类
多情感分类

使用案例

人机交互
智能客服情绪分析
分析客户语音中的情绪状态
提升客服响应质量和用户体验
心理健康
情绪状态监测
通过语音分析用户情绪变化
辅助心理健康评估