SER Odyssey Baseline WavLM Valence
MIT
基于WavLM架构的语音情绪识别模型,专门用于预测语音中的效价(valence)值,范围为0到1。
音频分类
Transformers
英语
S
3loi
71
1
SER Odyssey Baseline WavLM Arousal
MIT
基于WavLM架构的语音情绪识别基线模型,专门用于预测语音中的唤醒度值(0-1范围)
音频分类
Transformers
英语
S
3loi
72
2
SER Odyssey Baseline WavLM Dominance
MIT
基于WavLM架构的语音情绪识别模型,专用于预测语音中的支配度情绪特征
音频分类
Transformers
英语
S
3loi
15
1
SER Odyssey Baseline WavLM Categorical
MIT
基于WavLM架构的语音情绪识别基线模型,用于预测8种基本情绪类别
音频分类
Transformers
英语
S
3loi
581
8
Audio Cls Wavlm Libri Clean 100h Base Plus Minds14 Finetune
该模型是基于WavLM预训练模型在Minds14数据集上进行微调的语音分类模型,主要用于语音意图识别任务。
音频分类
Transformers
A
jonastokoliu
22
0
Wavlm Basic S F O 8batch 10sec 0.0001lr Unfrozen
基于microsoft/wavlm-large微调的语音处理模型,在评估集上达到80%准确率和79.57% F1分数
音频分类
Transformers
W
reralle
14
0
Wavlm Libri Clean 100h Large
基于microsoft/wavlm-large在LIBRISPEECH_ASR - CLEAN数据集上微调的自动语音识别模型
语音识别
Transformers
W
patrickvonplaten
8,171
3
Wavlm Large CORAA Pt Cv7
Apache-2.0
基于WavLM-large架构的葡萄牙语自动语音识别模型,在common_voice 7.0数据集上微调
语音识别
Transformers
其他
W
lgris
15
0
Wavlm Libri Clean 100h Base
基于microsoft/wavlm-base在LIBRISPEECH_ASR - CLEAN数据集上微调的自动语音识别模型
语音识别
Transformers
W
patrickvonplaten
6,515
1
Wavlm Base Libri Clean 100
基于WavLM架构的自动语音识别模型,在LibriSpeech CLEAN数据集(100小时)上微调
语音识别
Transformers
W
anjulRajendraSharma
73
0