W

Wavlm Base Emotion

由 jihedjabnoun 开发
基于WavLM-Base微调的语音情感识别模型,能够将音频分类为7种不同情感
下载量 111
发布时间 : 6/2/2025

模型简介

该模型是基于microsoft/wavlm-base微调的语音情感识别模型,主要用于从语音音频中识别愤怒、厌恶、恐惧、快乐、中性、悲伤和惊讶等7种情感。

模型特点

多情感分类
能够识别7种不同的情感状态
多数据集训练
在MELD、CREMA-D、TESS、RAVDESS和SAVEE等多个数据集上训练
说话人多样性
训练集包含380个独特的说话人,提高了模型泛化能力

模型能力

语音情感分类
音频特征提取
情感概率分布输出

使用案例

人机交互
智能客服情感分析
分析客户语音中的情感状态,改善服务质量
可识别客户满意度水平
心理健康
情绪状态监测
通过语音分析用户的情绪变化
可用于心理健康应用
AIbase
智启未来,您的人工智能解决方案智库
简体中文