wav2vec2微调
Deepfake Audio Detection V1
Apache-2.0
基于wav2vec2-base微调的深度伪造音频检测模型,准确率达99.66%
音频分类
Transformers
D
Zeyadd-Mostaffa
33
0
Wav2vec2 Base 100k Gtzan Music Genres Finetuned Wav2vec2 Ivan
基于wav2vec2架构的音乐流派分类模型,在GTZAN数据集上微调,准确率达98%
音频分类
Transformers
W
itmanov
32
1
Wav2vec2 Large Xlsr 53 Serbian Smart Home Commands
MIT
基于wav2vec2的塞尔维亚语智能家居语音指令识别模型,可识别7种控制指令
音频分类
其他
W
mradovic38
320
0
Wav2 Noise
Apache-2.0
基于facebook/wav2vec2-base微调的噪声识别模型,准确率达93.89%
音频分类
Transformers
W
zylin12
1
0
My Awesome Mind Model
Apache-2.0
基于facebook/wav2vec2-base在minds14数据集上微调的音频分类模型
音频分类
Transformers
M
faaany
1
0
Wav2vec2 Large Xlsr 53 Th Speech Emotion Recognition 3c
基于airesearch/wav2vec2-large-xlsr-53-th微调的泰语语音情感识别模型,支持愤怒、快乐、平静三种情感分类
音频分类
Transformers
W
Paranchai
9
0
Wav2vec2 Turkish Gender Classification
Apache-2.0
基于facebook/wav2vec2-base微调的土耳其语性别分类模型,在common_voice_17_0数据集上训练,测试集准确率达84.79%
音频分类
Transformers
W
candenizkocak
19
1
W2v Speech Emotion Recognition
MIT
基于Wav2Vec2架构微调的英语语音情感识别模型,可识别六种情感状态
音频分类
英语
W
Khoa
147
0
Wav2vec2 ASV Deepfake Audio Detection
Apache-2.0
基于facebook/wav2vec2-base微调的深度伪造音频检测模型,用于识别合成或篡改的语音内容
说话人处理
Transformers
W
Bisher
106
1
Audio Emotion Detection
Apache-2.0
本模型是基于facebook/wav2vec2-large-xlsr-53微调而成的音频情感检测模型,可识别7种情感状态
音频分类
Transformers
A
Hatman
630
8
Wav2vec2 Large Xls R 300m Amharic Demo Colab
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在common_voice_16_1数据集上微调的阿姆哈拉语语音识别模型
语音识别
Transformers
W
DipsankarSinha
18
2
Wav2vec2 Base ASVSpoof5 TUC N
Apache-2.0
基于wav2vec2-base微调的语音防伪检测模型,在评估集上达到88.89%准确率
音频分类
Transformers
W
DavidCombei
20
0
Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k
Apache-2.0
基于facebook/wav2vec2-large-lv60微调的英语音素识别模型,在TIMIT数据集上取得10.53%的音素错误率
语音识别
Transformers
英语
W
excalibur12
306
3
Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k 002
Apache-2.0
基于facebook/wav2vec2-large-lv60在TIMIT数据集上微调的英语音素识别模型,音素错误率10.53%
语音识别
Transformers
英语
W
excalibur12
103
1
Speechbrain Emotion Recognition Openvino
Apache-2.0
该模型使用微调的wav2vec2(基础)架构,在IEMOCAP数据集上训练,用于语音情感识别任务。
音频分类
英语
S
psakamoori
13
0
Wav2vec2 Large Xlrs Korean V5
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在zeroth_korean数据集上微调的韩语自动语音识别模型,词错误率为0.2433。
语音识别
Transformers
W
student-47
285
1
Deepfake Audio Detection
Apache-2.0
基于facebook/wav2vec2-base微调的深度伪造音频检测模型,在评估集上准确率达95.45%
音频分类
Transformers
D
Heem2
246
0
Wav2vec Base Crema Sentiment Analysis
Apache-2.0
基于facebook/wav2vec2-base微调的语音情感分析模型,在评估集上达到70.87%的准确率
音频分类
Transformers
W
Piyush2512
38
0
Violence Detect 44
Apache-2.0
基于facebook/wav2vec2-base-960h微调的音频分类模型,用于检测暴力声音
音频分类
Transformers
V
Hemg
28
0
Deeepfake Audio Recognition Ttoo
Apache-2.0
基于facebook/wav2vec2-base微调的深度伪造音频识别模型,在评估集上准确率达95.45%
音频分类
Transformers
D
Hemg
20
0
Wav2vec2 Base Arabic Speech Emotion Recognition
Apache-2.0
基于facebook/wav2vec2-base微调的阿拉伯语语音情感识别模型,在评估集上取得了99.92%的准确率。
音频分类
Transformers
W
ahmmedasaad2772
352
0
Wav2vec2 Base Gender Classification
Apache-2.0
基于facebook/wav2vec2-base微调的语音性别分类模型,在评估集上准确率达98.92%
音频分类
Transformers
W
7wolf
14
1
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
基于wav2vec2-large-xlsr-53-english模型在RAVDESS数据集上微调的语音情感识别模型
音频分类
Transformers
W
firdho26
68
0
My Awesome Mind Model
Apache-2.0
基于facebook/wav2vec2-base微调的音频分类模型,在评估集上达到58.92%的准确率
音频分类
Transformers
M
Krithika-p
15
0
Wav2vec2 Audio Emotion Classification
Apache-2.0
基于facebook/wav2vec2-base微调的音频情感分类模型,在评估集上准确率达73.98%
音频分类
Transformers
W
chin-may
77
5
Wav2vec2 Base Music Speech Both Classification Finetuned Gtzan
Apache-2.0
基于wav2vec2架构的音频分类模型,在GTZAN数据集上微调,用于音乐和语音分类任务
音频分类
Transformers
W
0bi0n3
15
1
Wav2vec2 Large Robust 24 Ft Age Gender
该模型以原始音频信号作为输入,输出年龄预测值以及性别概率(儿童/女性/男性),同时输出最后一层transformer的池化状态。
音频分类
Transformers
W
audeering
44.13k
33
Wav2vec Fine Tuned Speech Command2
Apache-2.0
基于facebook/wav2vec2-base在speech_commands数据集上微调的语音识别模型,准确率达97.35%
音频分类
Transformers
W
Thamer
16
0
Viet Tones Model
基于wav2vec2-base-vietnamese-250h微调的越南语声调识别模型,准确率59.72%
语音识别
Transformers
V
StevenLe456
22
0
Asr Wav2vec2 Commonvoice 14 Zh CN
Apache-2.0
这是一个基于CommonVoice中文数据集训练的端到端自动语音识别系统,使用wav2vec2.0和CTC架构,支持中文语音识别。
语音识别
中文
A
speechbrain
36
9
Asr Wav2vec2 Commonvoice 14 Es
Apache-2.0
这是一个基于CommonVoice西班牙语数据集训练的端到端自动语音识别系统,使用wav2vec 2.0预训练模型结合CTC解码器。
语音识别
西班牙语
A
speechbrain
22
3
Wav2vec2 Base Finetuned Gtzan
Apache-2.0
该模型是基于facebook/wav2vec2-base在GTZAN数据集上微调的音频分类模型,主要用于音乐流派分类任务。
音频分类
Transformers
W
wilson-wei
14
0
Wav2vec2 Base Down On
Apache-2.0
基于facebook/wav2vec2-base微调的二进制音频分类模型,专门用于区分'down'和'on'的发音
音频分类
Transformers
W
MatsRooth
20
0
Wav2vec2 Base Music Speech Both Classification
Apache-2.0
基于facebook/wav2vec2-base微调的音频分类模型,用于区分音乐和语音
音频分类
Transformers
W
FerhatDk
20
0
Wav2vec2 Nepali
基于Facebook的wav2vec2模型微调的尼泊尔语语音识别模型
语音识别
Transformers
其他
W
anish-shilpakar
312
1
Neunit Nihaochangchu V3
Apache-2.0
基于facebook/wav2vec2-base微调的音频分类模型,在superb数据集上训练,准确率达99.99%
音频分类
Transformers
N
SHENMU007
14
0
Bsc Ai Thesis Torgo Model 1
Apache-2.0
基于facebook/wav2vec2-base微调的语音处理模型,在评估集上表现出色
语音识别
Transformers
B
Juardo
19
0
SER Wav2vec2 Large Xlsr 53 Eng Zho Adults
基于wav2vec2-large-xlsr-53微调的跨语言跨年龄组语音情感识别模型,支持英语和中文
音频分类
Transformers
支持多种语言
S
CAiRE
32
0
Wav2musicgenre
Apache-2.0
基于facebook/wav2vec2-base微调的音频分类模型,用于识别音乐流派
音频分类
Transformers
W
ramonpzg
20
0
Finetuned Wav2vec2.0 Base On IEMOCAP 2
Apache-2.0
这是一个基于facebook/wav2vec2-base模型在IEMOCAP数据集上微调的语音情感识别模型,在评估集上取得了73.9%的准确率。
音频分类
Transformers
F
minoosh
32
2