Wav2vec Checkpoints
Apache-2.0
基于facebook/wav2vec2-base微调的语音处理模型,在评估集上准确率达99.48%
语音识别
Transformers

W
Zeyadd-Mostaffa
19
0
Distilhubert Finetuned Gtzan 5 Epochs Finetuned Gtzan Finetuned Gtzan
基于DistilHuBERT架构的音频分类模型,在GTZAN数据集上微调,用于音乐流派分类任务。
音频分类
Transformers

D
duysal
5
0
Deepfake Audio Detection
Apache-2.0
基于wav2vec2-base-finetuned进一步微调的语音处理模型,在评估集上准确率达98.82%
语音识别
Transformers

D
motheecreator
1,468
7
Wav2vec2 Base Finetuned
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音处理模型,在评估集上达到99.97%的准确率
语音识别
Transformers

W
mo-thecreator
19
4
Wav2vec2 Base Finetuned
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音处理模型,在评估集上准确率达99.97%
语音识别
Transformers

W
motheecreator
105
4
Distilhubert Finetuned Chorddetection
Apache-2.0
基于distilhubert模型微调的和弦检测模型,在ChordStimation数据集上训练,评估准确率达到100%
音频分类
Transformers

D
alejogil35
14
1
Karolgrv2
这是一个RVC(Retrieval-based Voice Conversion)模型,用于音频到音频的转换任务。
语音合成
Transformers

K
sail-rvc
6
0
Vocoder Daft Punk RVC 200 Epochs
这是一个RVC(实时语音转换)模型,经过200轮训练,适用于语音转换任务。
语音合成
Transformers

V
sail-rvc
1,304
0
Snoop
Snoop是一个基于RVC(Retrieval-based Voice Conversion)技术的音频转音频模型,主要用于语音转换任务。
语音合成
Transformers

S
sail-rvc
3,997
0
Ronaldo
这是一个基于RVC(Retrieval-based Voice Conversion)的语音转换模型,可以将输入音频转换为特定风格的语音。
语音合成
Transformers

R
sail-rvc
3,855
1
Drake RVC
Drake_RVC 是一个基于 RVC (Retrieval-based Voice Conversion) 技术的音频转音频模型,专门用于语音转换任务。
语音合成
Transformers

D
sail-rvc
5,043
1
Cardib2333333
这是一个基于RVC(Retrieval-based Voice Conversion)技术的语音转换模型,能够将输入的音频转换为特定风格的语音输出。
语音合成
Transformers

C
sail-rvc
807
1
CJ RVC V2 400 Epochs
这是一个基于RVC(Retrieval-based Voice Conversion)技术的语音转换模型,经过400轮训练,适用于音频转音频任务。
语音合成
Transformers

C
sail-rvc
1,949
0
Andrewtate
这是一个基于RVC(Retrieval-based Voice Conversion)技术的语音转换模型,可以将输入音频转换为安德鲁·泰特风格的声音。
语音合成
Transformers

A
sail-rvc
910
3
Alvin
这是一个RVC(Retrieval-based Voice Conversion)模型,用于音频到音频的转换任务。
语音合成
Transformers

A
sail-rvc
4,909
0
Audio Cls Unispeech Sat Base 100h Libri Ft Minds14 Finetune
Apache-2.0
基于microsoft/unispeech-sat-base-100h-libri-ft在minds14数据集上微调的语音分类模型
音频分类
Transformers

A
jonastokoliu
21
0
Wav2vec2 Base Finetuned Amd
Apache-2.0
该模型是基于facebook/wav2vec2-base在未知数据集上微调的版本,主要用于语音识别任务,在评估集上达到84.55%的准确率。
语音识别
Transformers

W
justin1983
14
0
Whisper Small Ft Common Language Id
Apache-2.0
基于openai/whisper-small微调的通用语言识别模型,在评估集上准确率达88.6%
音频分类
Transformers

W
sanchit-gandhi
256.20k
2
Wav2vec2 Base Finetuned Ie
Apache-2.0
基于facebook/wav2vec2-base模型微调的版本,用于特定任务
语音识别
Transformers

W
minoosh
14
0
Wav2vec2 Base Finetuned Ks
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音识别模型,在评估集上准确率达到87.27%。
语音识别
Transformers

W
FerhatDk
38
0
Wav2vec2 Base Ft Cv3 V3
Apache-2.0
该模型是基于facebook/wav2vec2-base在Common Voice 3.0英语数据集上微调的语音识别模型,在测试集上取得了0.247的词错误率。
语音识别
Transformers

W
danieleV9H
120
0
Wav2vec Trained
Apache-2.0
该模型是基于facebook/wav2vec2-base微调而成的语音识别模型,在评估集上取得了词错误率0.1042的表现。
语音识别
Transformers

W
eugenetanjc
70
0
Resepformer Wsj02mix
Apache-2.0
这是一个基于RE-SepFormer架构的音频源分离模型,由SpeechBrain实现并在WSJ0-2Mix数据集上训练。
声音分离
英语
R
speechbrain
488
3
Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在AI_LIGHT_DANCE - ONSET-SINGING数据集上微调的自动语音识别模型,主要用于歌唱语音识别任务。
语音识别
Transformers

A
gary109
23
1
Wav2vec2 Base Vios Commonvoice 1
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在Common Voice数据集上微调的语音识别模型,支持自动语音识别任务。
语音识别
Transformers

W
tclong
21
0
Wav2vec2 Final 1 Lm 3
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在评估集上词错误率为0.4499,使用4-Gram语言模型时可降至0.126
语音识别
Transformers

W
chrisvinsen
16
0
Wav2vec2 17
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,支持自动语音转文本任务。
语音识别
Transformers

W
chrisvinsen
17
0
Wav2vec2 11
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,支持自动语音转文本任务
语音识别
Transformers

W
chrisvinsen
18
0
Wav2vec2 10
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在评估集上词错误率(WER)为1.0
语音识别
Transformers

W
chrisvinsen
20
0
Wav2vec2 5
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,主要用于自动语音识别(ASR)任务
语音识别
Transformers

W
chrisvinsen
20
0
Wav2vec2 4
Apache-2.0
该模型是基于facebook/wav2vec2-base微调的语音识别模型,主要用于自动语音识别任务。
语音识别
Transformers

W
chrisvinsen
16
0
Wav2vec2 3
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,词错误率(WER)为1.0
语音识别
Transformers

W
chrisvinsen
16
0
Wav2vec2 Base Demo Colab
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音识别模型,在评估集上取得了31.42%的词错误率
语音识别
Transformers

W
brever
16
0
20220517 150219
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m微调的语音识别模型,支持自动语音识别(ASR)任务。
语音识别
Transformers

2
lilitket
29
0
Wav2vec2 Base Timit Demo Colab9
Apache-2.0
该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,主要用于英语语音转文本任务。
语音识别
Transformers

W
hassnain
16
0
Wav2vec2 Base Toy Train Data Augmented
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音识别模型,在增强训练数据上进行了优化。
语音识别
Transformers

W
scasutt
22
0
Wav2vec2 Base Cv
Apache-2.0
基于facebook/wav2vec2-base在common_voice数据集上微调的语音识别模型
语音识别
Transformers

W
jiobiala24
24
0
Wav2vec2 Base 1
Apache-2.0
基于facebook/wav2vec2-base在common_voice数据集上微调的语音识别模型
语音识别
Transformers

W
jiobiala24
20
0
Wav2vec2 Base Lj Demo Colab
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音识别模型,适用于英语语音转文本任务。
语音识别
Transformers

W
mohamed-illiyas
27
0
Wav2vec2 Base Demo Colab
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在特定数据集上训练,词错误率(WER)为0.3391。
语音识别
Transformers

W
asakawa
24
0
- 1
- 2
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文