S

SER Odyssey Baseline WavLM Arousal

由 3loi 开发
基于WavLM架构的语音情绪识别基线模型,专门用于预测语音中的唤醒度值(0-1范围)
下载量 72
发布时间 : 3/15/2024
模型介绍
内容详情
替代品

模型简介

该模型是Odyssey 2024情绪识别竞赛的基线模型,基于MSP-Podcast数据集训练,专注于单任务唤醒度预测。

模型特点

高精度唤醒度预测
在Test3和开发集上分别达到0.566和0.651的CCC指标
单任务专注设计
专门优化用于唤醒度预测,避免多任务干扰
标准化音频处理
内置均值/标准差标准化流程,确保输入一致性

模型能力

语音情绪分析
唤醒度值预测
音频特征提取

使用案例

心理健康监测
语音情绪状态评估
通过语音分析用户的情绪唤醒程度
可量化输出0-1范围的唤醒度值
人机交互
智能客服情绪响应
实时检测用户语音情绪状态以调整响应策略