E

Emotion Recognition Wav2vec2 IEMOCAP

由 speechbrain 开发
使用微调的wav2vec2模型进行语音情感识别,在IEMOCAP数据集上训练
下载量 237.65k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型通过分析语音信号识别说话人的情感状态,采用wav2vec2架构结合卷积和残差块,使用注意力统计池化提取特征

模型特点

高效特征提取
利用wav2vec2预训练模型提取语音特征,结合注意力统计池化增强情感相关特征
多情感分类
能够识别多种情感状态,在IEMOCAP数据集上达到78.7%的准确率
端到端处理
支持直接从原始音频输入进行情感分类,自动处理音频标准化

模型能力

语音情感识别
音频特征提取
情感状态分类

使用案例

人机交互
智能客服情绪分析
分析客户语音中的情绪状态,优化服务响应
可识别愤怒、高兴等基本情绪状态
心理健康
情绪状态监测
通过日常语音分析用户情绪变化