W

Wav2vec2 Xlsr English Speech Emotion Recognition

由 AreejB 开发
该模型用于从英语音频中识别六种基本情绪:愤怒、厌恶、恐惧、快乐、悲伤和惊讶,基于RAVDESS数据集训练。
下载量 82
发布时间 : 5/10/2024
模型介绍
内容详情
替代品

模型简介

采用Wav2Vec2架构的英语语音情感识别模型,能够从音频录音中提取情感特征并进行分类。

模型特点

多情感识别
能够识别六种基本情绪:愤怒、厌恶、恐惧、快乐、悲伤和惊讶
基于Wav2Vec2架构
利用预训练的Wav2Vec2模型进行微调,具有良好的语音特征提取能力
高准确率
在测试集上平均准确率达到84.84%,部分情感识别精确率超过90%

模型能力

英语语音情感识别
音频特征提取
多分类情感分析

使用案例

人机交互
智能客服情绪分析
分析客户语音中的情绪状态,提升服务质量
可识别愤怒、快乐等关键情绪,帮助客服及时调整策略
心理健康
情绪状态监测
通过语音分析用户情绪变化
可识别悲伤、恐惧等负面情绪,辅助心理评估