Wav2vec2 Vd Bird Sound Classification
MIT
基于wav2vec2-base训练的鸟类声音分类模型,可识别21种印度Vedanthangal鸟类保护区的鸟类物种
音频分类
Transformers

英语
W
greenarcade
133
1
Voiceguard
MIT
基于Wav2Vec2微调的音频分类器,能够区分真人语音和AI生成语音。
音频分类
Transformers

英语
V
Mrkomiljon
127
1
Wavlm Large Finetuned SER
基于WavLM-Large的语音情感识别模型,支持英文语音情感分类。
音频分类
英语
W
JBJoyce
139
0
Whisper Tiny De Emodb Emotion Classification
Apache-2.0
基于openai/whisper-tiny微调的德语情感分类模型,在Emo-DB数据集上达到91.59%准确率
音频分类
Transformers

德语
W
Flocksserver
27
0
Distilhubert Finetuned Cry Detector
Apache-2.0
基于distilhubert架构微调的哭声检测模型,在评估集上表现出色,准确率达98.83%
音频分类
Transformers

D
Marcos12886
22
1
Deepfake Audio Detection
Apache-2.0
基于音频文件夹数据集微调的Deepfake音频检测模型,能够高效识别合成语音,评估准确率达99.64%
音频分类
Transformers

D
MelodyMachine
107
0
Deepfake Audio Detection
Apache-2.0
基于facebook/wav2vec2-base微调的深度伪造音频检测模型,在评估集上准确率达95.45%
音频分类
Transformers

D
Heem2
246
0
Urdu Emotions Whisper Medium
Apache-2.0
基于Whisper-medium微调的乌尔都语情感识别模型,在评估集上准确率达91.67%
音频分类
Transformers

U
Pak-Speech-Processing
43
0
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
基于wav2vec2-large-xlsr-53-english模型在RAVDESS数据集上微调的语音情感识别模型
音频分类
Transformers

W
firdho26
68
0
AST ASVspoof2019 Synthetic Voice Detection
MIT
该模型是基于MIT/ast-finetuned-audioset-10-10-0.4593微调的版本,用于检测合成语音。
音频分类
Transformers

英语
A
MattyB95
18
1
Wav2vec2 Animal Sounds Finetuned Hubert Finetuned Animals
Apache-2.0
基于HuBERT架构微调的动物声音分类模型,可识别10类动物叫声,准确率达95%
音频分类
Transformers

W
ardneebwar
555
7
Wav2vec2 Large Robust 6 Ft Age Gender Finetuned Gtzan
基于wav2vec2架构的音频分类模型,在privateSLI数据集上微调,用于年龄和性别识别任务
音频分类
Transformers

W
languageresearch
15
0
Ast Finetuned Speech Commands V2
Bsd-3-clause
基于Speech Commands v2数据集微调的音频频谱图变换器模型,用于音频分类任务,准确率达98.12%。
音频分类
Transformers

A
MIT
10.94k
15
Trillsson3 Ft Keyword Spotting 14
基于TRillsson3架构的音频分类模型,在superb数据集上微调,用于关键词识别任务,准确率达91.5%。
音频分类
Transformers

T
vumichien
47
0
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文