S

Speech Emotion Recognition Wav2vec2 Large Xlsr 53 240304 SER Fine Tuned2.0

由 hughlan1214 开发
基于wav2vec2-large-xlsr-53的语音情感识别模型,支持7种情感分类
下载量 145
发布时间 : 3/4/2024

模型简介

该模型通过微调facebook/wav2vec2-large-xlsr-53实现,能够识别语音中的7种情感类型(愤怒、厌恶、恐惧、快乐、中性、悲伤、惊讶),为多模态情绪分析提供基础。

模型特点

跨语言能力
尽管仅使用英文数据训练,但模型在中文和法语情感识别上也表现良好
多情感分类
可识别7种不同的人类基本情感状态
多数据集融合训练
基于Crema、Ravdess、Savee和Tess四个主流语音情感数据集的融合数据训练

模型能力

语音情感识别
跨语言情感分析
实时情绪推断

使用案例

人机交互
智能客服情绪分析
实时分析客户语音中的情绪状态
提升客服响应质量和用户体验
心理健康
情绪状态监测
通过语音分析用户情绪变化
辅助心理健康评估
AIbase
智启未来,您的人工智能解决方案智库
简体中文