S

SER Odyssey Baseline WavLM Multi Attributes

由 3loi 开发
基于WavLM架构的多属性语音情绪识别基线模型,用于预测激活度、支配度和效价三个情绪维度
下载量 23.09k
发布时间 : 3/5/2024

模型简介

该模型是基于MSP-Podcast数据集训练的语音情绪识别模型,专门为Odyssey 2024情绪识别竞赛开发的基线模型。它能同时预测语音中的激活度、支配度和效价三个情绪维度,输出值范围在0到1之间。

模型特点

多属性情绪预测
同时预测激活度、支配度和效价三个情绪维度,提供更全面的情绪分析
基于MSP-Podcast数据集
使用专业的情感语音数据集训练,具有较高的可靠性
标准化音频处理
内置均值/标准差标准化处理,确保输入音频质量一致

模型能力

语音情绪识别
激活度预测
支配度预测
效价预测
音频分类

使用案例

情感计算
语音情感分析
分析语音中的情绪状态,用于心理学研究或用户体验评估
能准确识别激活度、支配度和效价三个情绪维度
人机交互
智能客服情绪识别
实时识别用户语音中的情绪状态,优化客服响应策略
AIbase
智启未来,您的人工智能解决方案智库
简体中文