X

Xlsr Wav2vec Speech Emotion Recognition

由 harshit345 开发
基于XLSR-Wav2Vec架构的语音情感识别模型,能够识别五种基本情感:愤怒、厌恶、恐惧、快乐和悲伤。
下载量 498
发布时间 : 3/2/2022

模型简介

该模型使用Wav2Vec2架构进行语音情感分类,适用于从语音信号中识别说话者的情感状态。

模型特点

多情感识别
能够识别五种基本情感:愤怒、厌恶、恐惧、快乐和悲伤。
基于Wav2Vec2架构
利用Wav2Vec2的自监督学习能力,在语音情感识别任务上表现良好。
高准确率
在测试数据上整体准确率达到80.6%,各类情感识别表现均衡。

模型能力

语音情感分类
语音信号处理
情感概率评分

使用案例

人机交互
客服系统情感分析
分析客户语音中的情感状态,帮助客服系统做出更智能的响应。
可准确识别客户愤怒、不满等负面情绪
心理健康
情绪状态监测
通过日常语音分析用户的情绪变化。
可用于抑郁症等心理疾病的辅助诊断
AIbase
智启未来,您的人工智能解决方案智库
简体中文