W

Wav2vec2 Base Superb Er

由 superb 开发
这是一个基于Wav2Vec2架构的语音情感识别模型,移植自S3PRL项目,用于识别语音中的情感类别。
下载量 28.14k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于wav2vec2-base架构,在16kHz采样的语音音频上进行预训练,专门用于情感识别任务。

模型特点

基于Wav2Vec2架构
采用高效的wav2vec2-base架构,在语音处理任务中表现优异
情感分类
能够识别语音中的四种主要情感类别
16kHz采样支持
专门针对16kHz采样的语音音频进行优化

模型能力

语音情感识别
音频分类

使用案例

情感分析
客服语音分析
分析客服通话中的客户情绪
可识别高兴、中性等情绪状态
心理状态评估
通过语音分析评估说话者的心理状态