高精度音频分类
Wav2vec2 Vd Bird Sound Classification
MIT
基于wav2vec2-base训练的鸟类声音分类模型,可识别21种印度Vedanthangal鸟类保护区的鸟类物种
音频分类
Transformers
英语
W
greenarcade
133
1
Voiceguard
MIT
基于Wav2Vec2微调的音频分类器,能够区分真人语音和AI生成语音。
音频分类
Transformers
英语
V
Mrkomiljon
127
1
Wavlm Large Finetuned SER
基于WavLM-Large的语音情感识别模型,支持英文语音情感分类。
音频分类
英语
W
JBJoyce
139
0
Whisper Tiny De Emodb Emotion Classification
Apache-2.0
基于openai/whisper-tiny微调的德语情感分类模型,在Emo-DB数据集上达到91.59%准确率
音频分类
Transformers
德语
W
Flocksserver
27
0
Distilhubert Finetuned Cry Detector
Apache-2.0
基于distilhubert架构微调的哭声检测模型,在评估集上表现出色,准确率达98.83%
音频分类
Transformers
D
Marcos12886
22
1
Deepfake Audio Detection
Apache-2.0
基于音频文件夹数据集微调的Deepfake音频检测模型,能够高效识别合成语音,评估准确率达99.64%
音频分类
Transformers
D
MelodyMachine
107
0
Deepfake Audio Detection
Apache-2.0
基于facebook/wav2vec2-base微调的深度伪造音频检测模型,在评估集上准确率达95.45%
音频分类
Transformers
D
Heem2
246
0
Urdu Emotions Whisper Medium
Apache-2.0
基于Whisper-medium微调的乌尔都语情感识别模型,在评估集上准确率达91.67%
音频分类
Transformers
U
Pak-Speech-Processing
43
0
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
基于wav2vec2-large-xlsr-53-english模型在RAVDESS数据集上微调的语音情感识别模型
音频分类
Transformers
W
firdho26
68
0
AST ASVspoof2019 Synthetic Voice Detection
MIT
该模型是基于MIT/ast-finetuned-audioset-10-10-0.4593微调的版本,用于检测合成语音。
音频分类
Transformers
英语
A
MattyB95
18
1
Wav2vec2 Animal Sounds Finetuned Hubert Finetuned Animals
Apache-2.0
基于HuBERT架构微调的动物声音分类模型,可识别10类动物叫声,准确率达95%
音频分类
Transformers
W
ardneebwar
555
7
Wav2vec2 Large Robust 6 Ft Age Gender Finetuned Gtzan
基于wav2vec2架构的音频分类模型,在privateSLI数据集上微调,用于年龄和性别识别任务
音频分类
Transformers
W
languageresearch
15
0
Ast Finetuned Speech Commands V2
Bsd-3-clause
基于Speech Commands v2数据集微调的音频频谱图变换器模型,用于音频分类任务,准确率达98.12%。
音频分类
Transformers
A
MIT
10.94k
15
Trillsson3 Ft Keyword Spotting 14
基于TRillsson3架构的音频分类模型,在superb数据集上微调,用于关键词识别任务,准确率达91.5%。
音频分类
Transformers
T
vumichien
47
0