W

Wav2vec2 Large Xlsr 53 Th Speech Emotion Recognition 3c 10ep

由 Paranchai 开发
基于 airesearch/wav2vec2-large-xlsr-53-th 微调的语音情感识别模型,在评估集上达到85.79%准确率
下载量 9
发布时间 : 10/14/2024
模型介绍
内容详情
替代品

模型简介

该模型是针对泰语语音情感识别任务微调的wav2vec2模型,能够识别语音中的情感类别

模型特点

高准确率
在评估集上达到85.79%的情感识别准确率
基于预训练模型
基于强大的airesearch/wav2vec2-large-xlsr-53-th模型微调
优化训练
经过10个epoch的精细调优,使用线性学习率调度和预热

模型能力

泰语语音情感识别
语音特征提取
三分类情感识别

使用案例

情感分析
客服语音情感分析
分析客户服务通话中的客户情感状态
可识别85.79%的情感类别
心理健康监测
通过语音分析用户情绪状态