S

SER Odyssey Baseline WavLM Categorical

由 3loi 开发
基于WavLM架构的语音情绪识别基线模型,用于预测8种基本情绪类别
下载量 581
发布时间 : 3/7/2024
模型介绍
内容详情
替代品

模型简介

该模型是基于MSP-Podcast数据集训练的语音情绪识别分类模型,作为Odyssey 2024情绪识别竞赛的基线模型,可预测愤怒、悲伤、快乐等8种情绪类别。

模型特点

多情绪分类
可识别8种基本情绪类别:愤怒、悲伤、快乐、惊讶、恐惧、厌恶、轻蔑和中性
标准化音频处理
支持均值/标准差归一化预处理,提高模型识别准确率
竞赛基线模型
作为Odyssey 2024情绪识别竞赛的官方基线模型,具有参考价值

模型能力

语音情绪识别
音频分类
多类别情感分析

使用案例

人机交互
语音助手情绪响应
通过识别用户语音情绪调整交互策略
提升人机交互的自然度和用户体验
心理健康
情绪状态监测
分析语音记录中的情绪变化
辅助心理健康评估和干预