Deepfake Audio Detection V1
Apache-2.0
基于wav2vec2-base微调的深度伪造音频检测模型,准确率达99.66%
音频分类
Transformers

D
Zeyadd-Mostaffa
33
0
Wav2vec2 Base 100k Gtzan Music Genres Finetuned Wav2vec2 Ivan
基于wav2vec2架构的音乐流派分类模型,在GTZAN数据集上微调,准确率达98%
音频分类
Transformers

W
itmanov
32
1
Wav2vec2 Large Xlsr 53 Serbian Smart Home Commands
MIT
基于wav2vec2的塞尔维亚语智能家居语音指令识别模型,可识别7种控制指令
音频分类
其他
W
mradovic38
320
0
Wav2 Noise
Apache-2.0
基于facebook/wav2vec2-base微调的噪声识别模型,准确率达93.89%
音频分类
Transformers

W
zylin12
1
0
My Awesome Mind Model
Apache-2.0
基于facebook/wav2vec2-base在minds14数据集上微调的音频分类模型
音频分类
Transformers

M
faaany
1
0
Wav2vec2 Large Xlsr 53 Th Speech Emotion Recognition 3c
基于airesearch/wav2vec2-large-xlsr-53-th微调的泰语语音情感识别模型,支持愤怒、快乐、平静三种情感分类
音频分类
Transformers

W
Paranchai
9
0
Wav2vec2 Turkish Gender Classification
Apache-2.0
基于facebook/wav2vec2-base微调的土耳其语性别分类模型,在common_voice_17_0数据集上训练,测试集准确率达84.79%
音频分类
Transformers

W
candenizkocak
19
1
W2v Speech Emotion Recognition
MIT
基于Wav2Vec2架构微调的英语语音情感识别模型,可识别六种情感状态
音频分类
英语
W
Khoa
147
0
Wav2vec2 ASV Deepfake Audio Detection
Apache-2.0
基于facebook/wav2vec2-base微调的深度伪造音频检测模型,用于识别合成或篡改的语音内容
说话人处理
Transformers

W
Bisher
106
1
Audio Emotion Detection
Apache-2.0
本模型是基于facebook/wav2vec2-large-xlsr-53微调而成的音频情感检测模型,可识别7种情感状态
音频分类
Transformers

A
Hatman
630
8
Wav2vec2 Large Xls R 300m Amharic Demo Colab
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在common_voice_16_1数据集上微调的阿姆哈拉语语音识别模型
语音识别
Transformers

W
DipsankarSinha
18
2
Wav2vec2 Base ASVSpoof5 TUC N
Apache-2.0
基于wav2vec2-base微调的语音防伪检测模型,在评估集上达到88.89%准确率
音频分类
Transformers

W
DavidCombei
20
0
Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k
Apache-2.0
基于facebook/wav2vec2-large-lv60微调的英语音素识别模型,在TIMIT数据集上取得10.53%的音素错误率
语音识别
Transformers

英语
W
excalibur12
306
3
Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k 002
Apache-2.0
基于facebook/wav2vec2-large-lv60在TIMIT数据集上微调的英语音素识别模型,音素错误率10.53%
语音识别
Transformers

英语
W
excalibur12
103
1
Speechbrain Emotion Recognition Openvino
Apache-2.0
该模型使用微调的wav2vec2(基础)架构,在IEMOCAP数据集上训练,用于语音情感识别任务。
音频分类
英语
S
psakamoori
13
0
Wav2vec2 Large Xlrs Korean V5
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在zeroth_korean数据集上微调的韩语自动语音识别模型,词错误率为0.2433。
语音识别
Transformers

W
student-47
285
1
Deepfake Audio Detection
Apache-2.0
基于facebook/wav2vec2-base微调的深度伪造音频检测模型,在评估集上准确率达95.45%
音频分类
Transformers

D
Heem2
246
0
Wav2vec Base Crema Sentiment Analysis
Apache-2.0
基于facebook/wav2vec2-base微调的语音情感分析模型,在评估集上达到70.87%的准确率
音频分类
Transformers

W
Piyush2512
38
0
Violence Detect 44
Apache-2.0
基于facebook/wav2vec2-base-960h微调的音频分类模型,用于检测暴力声音
音频分类
Transformers

V
Hemg
28
0
Deeepfake Audio Recognition Ttoo
Apache-2.0
基于facebook/wav2vec2-base微调的深度伪造音频识别模型,在评估集上准确率达95.45%
音频分类
Transformers

D
Hemg
20
0
Wav2vec2 Base Arabic Speech Emotion Recognition
Apache-2.0
基于facebook/wav2vec2-base微调的阿拉伯语语音情感识别模型,在评估集上取得了99.92%的准确率。
音频分类
Transformers

W
ahmmedasaad2772
352
0
Wav2vec2 Base Gender Classification
Apache-2.0
基于facebook/wav2vec2-base微调的语音性别分类模型,在评估集上准确率达98.92%
音频分类
Transformers

W
7wolf
14
1
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
基于wav2vec2-large-xlsr-53-english模型在RAVDESS数据集上微调的语音情感识别模型
音频分类
Transformers

W
firdho26
68
0
My Awesome Mind Model
Apache-2.0
基于facebook/wav2vec2-base微调的音频分类模型,在评估集上达到58.92%的准确率
音频分类
Transformers

M
Krithika-p
15
0
Wav2vec2 Audio Emotion Classification
Apache-2.0
基于facebook/wav2vec2-base微调的音频情感分类模型,在评估集上准确率达73.98%
音频分类
Transformers

W
chin-may
77
5
Wav2vec2 Base Music Speech Both Classification Finetuned Gtzan
Apache-2.0
基于wav2vec2架构的音频分类模型,在GTZAN数据集上微调,用于音乐和语音分类任务
音频分类
Transformers

W
0bi0n3
15
1
Wav2vec2 Large Robust 24 Ft Age Gender
该模型以原始音频信号作为输入,输出年龄预测值以及性别概率(儿童/女性/男性),同时输出最后一层transformer的池化状态。
音频分类
Transformers

W
audeering
44.13k
33
Wav2vec Fine Tuned Speech Command2
Apache-2.0
基于facebook/wav2vec2-base在speech_commands数据集上微调的语音识别模型,准确率达97.35%
音频分类
Transformers

W
Thamer
16
0
Viet Tones Model
基于wav2vec2-base-vietnamese-250h微调的越南语声调识别模型,准确率59.72%
语音识别
Transformers

V
StevenLe456
22
0
Asr Wav2vec2 Commonvoice 14 Zh CN
Apache-2.0
这是一个基于CommonVoice中文数据集训练的端到端自动语音识别系统,使用wav2vec2.0和CTC架构,支持中文语音识别。
语音识别
中文
A
speechbrain
36
9
Asr Wav2vec2 Commonvoice 14 Es
Apache-2.0
这是一个基于CommonVoice西班牙语数据集训练的端到端自动语音识别系统,使用wav2vec 2.0预训练模型结合CTC解码器。
语音识别
西班牙语
A
speechbrain
22
3
Wav2vec2 Base Finetuned Gtzan
Apache-2.0
该模型是基于facebook/wav2vec2-base在GTZAN数据集上微调的音频分类模型,主要用于音乐流派分类任务。
音频分类
Transformers

W
wilson-wei
14
0
Wav2vec2 Base Down On
Apache-2.0
基于facebook/wav2vec2-base微调的二进制音频分类模型,专门用于区分'down'和'on'的发音
音频分类
Transformers

W
MatsRooth
20
0
Wav2vec2 Base Music Speech Both Classification
Apache-2.0
基于facebook/wav2vec2-base微调的音频分类模型,用于区分音乐和语音
音频分类
Transformers

W
FerhatDk
20
0
Wav2vec2 Nepali
基于Facebook的wav2vec2模型微调的尼泊尔语语音识别模型
语音识别
Transformers

其他
W
anish-shilpakar
312
1
Neunit Nihaochangchu V3
Apache-2.0
基于facebook/wav2vec2-base微调的音频分类模型,在superb数据集上训练,准确率达99.99%
音频分类
Transformers

N
SHENMU007
14
0
Bsc Ai Thesis Torgo Model 1
Apache-2.0
基于facebook/wav2vec2-base微调的语音处理模型,在评估集上表现出色
语音识别
Transformers

B
Juardo
19
0
SER Wav2vec2 Large Xlsr 53 Eng Zho Adults
基于wav2vec2-large-xlsr-53微调的跨语言跨年龄组语音情感识别模型,支持英语和中文
音频分类
Transformers

支持多种语言
S
CAiRE
32
0
Wav2musicgenre
Apache-2.0
基于facebook/wav2vec2-base微调的音频分类模型,用于识别音乐流派
音频分类
Transformers

W
ramonpzg
20
0
Finetuned Wav2vec2.0 Base On IEMOCAP 2
Apache-2.0
这是一个基于facebook/wav2vec2-base模型在IEMOCAP数据集上微调的语音情感识别模型,在评估集上取得了73.9%的准确率。
音频分类
Transformers

F
minoosh
32
2
- 1
- 2
- 3
- 4
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文