S

SER Odyssey Baseline WavLM Valence

由 3loi 开发
基于WavLM架构的语音情绪识别模型,专门用于预测语音中的效价(valence)值,范围为0到1。
下载量 71
发布时间 : 3/15/2024
模型介绍
内容详情
替代品

模型简介

该模型是针对Odyssey 2024情绪识别竞赛开发的基线模型,专注于单任务效价预测,基于MSP-Podcast数据集训练。

模型特点

高效价预测
专注于语音中的效价(valence)预测,输出范围在0到1之间。
基于MSP-Podcast数据集
使用MSP-Podcast数据集训练,该数据集专门用于语音情绪识别研究。
竞赛基线模型
作为Odyssey 2024情绪识别竞赛的基线模型,具有可靠的性能基准。

模型能力

语音情绪识别
效价预测
音频分类

使用案例

语音情绪分析
语音情感分析
分析语音中的情绪效价,用于情感计算和人机交互。
在Odyssey竞赛Test3和开发集上CCC指标分别为0.607和0.709。