语音情感识别

# 语音情感识别

Wavlm Base Emotion

基于WavLM-Base微调的语音情感识别模型，能够将音频分类为7种不同情感

Transformers 英语

Whisper Large V3 Msp Podcast Emotion

基于Whisper-Large V3的语音情感识别模型，专为MSP-Podcast数据集优化，支持9种情感分类

Safetensors 英语

Ast Finetuned Model

这是一个基于音频频谱图变压器（AST）的微调模型，专门用于语音音频中的情感分类。

Transformers 英语

Wavlm Large Finetuned SER

基于WavLM-Large的语音情感识别模型，支持英文语音情感分类。

音频分类英语

Speech Emotion Recognition With Openai Whisper Large V3

本项目利用Whisper模型实现语音情感识别，能够将音频分类为快乐、悲伤、惊讶等不同情感类别。

Speechbrain Emotion Recognition Openvino

该模型使用微调的wav2vec2（基础）架构，在IEMOCAP数据集上训练，用于语音情感识别任务。

音频分类英语

Speech Emotion Recognition Wav2vec2 Large Xlsr 53 240304 SER Fine Tuned2.0

基于wav2vec2-large-xlsr-53的语音情感识别模型，支持7种情感分类

Wav2vec2 Large Xlsr 53 English Finetuned Ravdess

基于wav2vec2-large-xlsr-53-english模型在RAVDESS数据集上微调的语音情感识别模型

Wav2vec2 Audio Emotion Classification

基于facebook/wav2vec2-base微调的音频情感分类模型，用于分析语音中的情感状态

Wav2vec2 Audio Emotion Classification

基于facebook/wav2vec2-base微调的音频情感分类模型，在评估集上准确率达73.98%

Wav2vec2 Lg Xlsr En Speech Emotion Recognition Finetuned Ravdess V8

基于wav2vec2架构的英语语音情感识别模型，在RAVDESS数据集上微调

Emotion Diarization Wavlm Large

使用WavLM Large模型进行微调，用于语音情感识别和说话人日志分析，支持多种情感分类

音频分类英语

Distilhubert Finetuned Ravdess

基于DistilHuBERT架构在RAVDESS语音情感数据集上微调的语音情感识别模型，准确率达92.36%

Finetuned Wav2vec2.0 Base On IEMOCAP 2

这是一个基于facebook/wav2vec2-base模型在IEMOCAP数据集上微调的语音情感识别模型，在评估集上取得了73.9%的准确率。

基于facebook/wav2vec2-base微调的语音情感识别模型，在评估集上达到73.22%的准确率

Astie Finetuned On Shemo

本模型是在shEMO数据集上对AST模型进行微调的版本，主要用于语音情感识别任务。

Iewav2vec2 Finetuned On Shemo

该模型是基于minoosh/wav2vec2-base-finetuned-ie在shEMO数据集上微调的版本，主要用于语音情感识别任务。

Ser Model Adjusted 2023 03 03

基于facebook/wav2vec2-base微调的语音情感识别模型，在评估集上准确率达到75.73%

Ser Model Fixed Label

基于facebook/wav2vec2-base微调的语音情感识别模型，在评估集上准确率达到83.67%

基于facebook/wav2vec2-base微调的语音情感识别模型，在评估集上准确率达到84.71%

Wav2vec2 Base Finetuned Sentiment Mesd

基于facebook/wav2vec2-base在MESD数据集上微调的西班牙语音频情感分类模型

somosnlp-hackathon-2022

Wav2vec2 Lg Xlsr En Speech Emotion Recognition

基于Wav2Vec 2.0微调的语音情感识别模型，支持识别8种英语情感，在RAVDESS数据集上准确率达82.23%

Wav2vec2 Large Superb Er

这是一个基于Wav2Vec2-Large模型的情感识别模型，专门用于从语音中识别情感类别。

Transformers 英语

Xlsr Wav2vec Speech Emotion Recognition

基于XLSR-Wav2Vec架构的语音情感识别模型，能够识别五种基本情感：愤怒、厌恶、恐惧、快乐和悲伤。

Transformers 英语

Wav2vec2 Base Superb Er

这是一个基于Wav2Vec2架构的语音情感识别模型，移植自S3PRL项目，用于识别语音中的情感类别。

Transformers 英语

Hubert Base Superb Er

该模型是基于Hubert-Base架构的情感识别模型，在SUPERB情感识别任务上训练，用于语音情感分类

Transformers 英语

Hubert Large Superb Er

基于Hubert-Large预训练模型的情感识别模型，用于预测语音中的情感类别

Transformers 英语

基于Hubert架构的语音情感识别模型，能够从音频中识别说话者的情感状态。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24