高准确率音频分类
Wav2vec2 Turkish Gender Classification
Apache-2.0
基于facebook/wav2vec2-base微调的土耳其语性别分类模型,在common_voice_17_0数据集上训练,测试集准确率达84.79%
音频分类
Transformers
W
candenizkocak
19
1
Whisper Tiny Bn Emo
基于shhossain/whisper-tiny-bn微调的情感分类模型,可识别孟加拉语中的7种基础情感
音频分类
Transformers
其他
W
shhossain
20
1
Speechcommand Demo
Apache-2.0
基于facebook/wav2vec2-base微调的语音命令分类模型,在superb数据集上训练,准确率达98.09%
音频分类
Transformers
S
SHENMU007
18
0
Whisper Tiny Ft Marathi Numbers
Apache-2.0
该模型是基于openai/whisper-tiny在马拉地语数字数据集上微调的版本,专门用于马拉地语数字的音频分类任务。
音频分类
Transformers
W
sanchit-gandhi
13
0
Internal.wav2vec2 Base Superb Ks Int8 Structured79
Apache-2.0
该模型是基于wav2vec2-base-ft-keyword-spotting在superb数据集上微调的版本,用于音频分类任务,经过量化和结构化剪枝优化。
音频分类
Transformers
I
yujiepan
16
0
Trillsson3 Ft Keyword Spotting
基于TRillsson3架构的音频分类模型,在superb数据集上微调,用于关键词识别任务
音频分类
Transformers
T
vumichien
30
0
Trillsson3 Ft Keyword Spotting 13
基于TRillsson3架构的音频分类模型,在superb数据集上微调,用于关键词识别任务
音频分类
Transformers
T
vumichien
32
0
Trillsson3 Ft Keyword Spotting 12
基于TRillsson3架构的音频分类模型,在关键词检测任务上进行了微调,在评估集上达到91.5%的准确率。
音频分类
Transformers
T
vumichien
32
1
Trillsson3 Ft Keyword Spotting 11
基于TRillsson3架构的音频分类模型,在superb数据集上微调,用于关键词识别任务
音频分类
Transformers
T
vumichien
32
0
Urdu Audio Emotions
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53微调的乌尔都语音频情感分类模型,支持愤怒、快乐、平静、悲伤四类情感识别
音频分类
Transformers
U
Talha
66
15