A

Ast Finetuned Model

由 forwarder1121 开发
这是一个基于音频频谱图变压器(AST)的微调模型,专门用于语音音频中的情感分类。
下载量 174
发布时间 : 11/17/2024
模型介绍
内容详情
替代品

模型简介

该模型在CREMA-D数据集上进行了微调,专注于六种情感类别(愤怒、厌恶、恐惧、快乐、中性、悲伤),适用于语音情感识别任务。

模型特点

基于音频频谱图变压器
采用先进的音频频谱图变压器架构,能够有效捕捉语音中的情感特征。
六种情感分类
支持愤怒、厌恶、恐惧、快乐、中性和悲伤六种情感类别的识别。
数据增强
训练过程中使用了噪声注入、时间偏移和速度扰动等数据增强技术,提升模型鲁棒性。

模型能力

语音情感识别
音频分类
情感分析

使用案例

人机交互
智能客服情感分析
用于分析用户在客服通话中的情感状态,提升服务质量。
心理健康
情绪状态监测
通过语音分析用户的情绪变化,用于心理健康应用。