S

Speech Emotion Recognition With Openai Whisper Large V3

由 firdhokk 开发
本项目利用Whisper模型实现语音情感识别,能够将音频分类为快乐、悲伤、惊讶等不同情感类别。
下载量 7,750
发布时间 : 9/21/2024
模型介绍
内容详情
替代品

模型简介

该模型是基于OpenAI Whisper Large V3微调的语音情感识别模型,能够准确识别语音中的情感类别。

模型特点

高准确率情感识别
模型在测试集上达到91.99%的准确率,能够有效识别多种语音情感。
基于Whisper架构
利用Whisper Large V3的强大音频处理能力进行微调,继承了其优秀的特征提取能力。
多数据集训练
整合RAVDESS、SAVEE、TESS和URDU等多个语音情感数据集进行训练,提高泛化能力。

模型能力

语音情感识别
音频分类
多情感类别识别

使用案例

心理健康分析
心理咨询辅助
通过分析客户语音情感变化,辅助心理咨询师评估客户情绪状态。
准确识别7种主要情感状态
客户服务
客服质量监控
自动分析客服通话中的情感变化,评估服务质量。
可实时监控客服情绪状态