W

Wav2vec2 Ser English Finetuned

由 dihuzz 开发
该模型基于Wav2Vec2架构微调训练,专门用于识别英语语音中的六种情绪状态(悲伤、愤怒、厌恶、恐惧、快乐、中性),准确率达92.42%。
下载量 68
发布时间 : 4/11/2025
模型介绍
内容详情
替代品

模型简介

一个经过微调的Wav2Vec2模型,用于英语语音情绪识别任务,能够准确分类六种基本情绪。

模型特点

高准确率
在测试集上达到92.42%的准确率,损失值仅为0.219
多情绪识别
可识别六种基本情绪:悲伤、愤怒、厌恶、恐惧、快乐和中性
基于Wav2Vec2架构
利用Wav2Vec2的强大特征提取能力进行语音情绪分类
轻量级推理
适合实时应用场景,可在普通GPU上高效运行

模型能力

英语语音情绪分类
实时情绪分析
语音情感识别

使用案例

心理健康
心理状态监测
通过语音分析用户情绪状态,用于心理健康应用
可自动识别用户情绪变化
客户服务
客服质量评估
分析客服通话中的情绪状态
帮助提升服务质量
人机交互
情感化语音助手
使语音助手能够理解用户情绪并做出相应回应
提升用户体验