中文语音识别
Belle Whisper Large V3 Turbo Zh Ct2
Apache-2.0
这是BELLE-2/Belle-whisper-large-v3-turbo-zh模型的CTranslate2格式转换版本,适用于高效语音识别任务。
语音识别
B
flateon
32
2
Belle Whisper Large V3 Turbo Zh
Apache-2.0
基于whisper-large-v3-turbo微调的中文语音识别模型,在多个中文语音识别基准测试中性能提升显著
语音识别
Transformers
B
BELLE-2
2,891
55
Whisper Tiny Chinese
Apache-2.0
基于OpenAI Whisper Tiny模型在Common Voice 11.0中文数据集上微调的语音识别模型
语音识别
Transformers
中文
W
jethrowang
99
1
Belle Whisper Large V3 Zh
Apache-2.0
基于whisper-large-v3微调优化的中文语音识别模型,在多个中文语音基准测试中性能显著提升
语音识别
Transformers
B
BELLE-2
1,666
112
Belle Distilwhisper Large V2 Zh
Apache-2.0
基于distilwhisper-large-v2微调的中文语音识别模型,速度是whisper-large-v2的5.8倍,参数减少51%
语音识别
Transformers
B
BELLE-2
230
37
Belle Whisper Large V2 Zh
Apache-2.0
基于whisper-large-v2进行微调的中文语音识别模型,在多个中文语音识别基准测试中实现了30-70%的相对性能提升。
语音识别
Transformers
B
BELLE-2
140
33
Asr Wav2vec2 Commonvoice 14 Zh CN
Apache-2.0
这是一个基于CommonVoice中文数据集训练的端到端自动语音识别系统,使用wav2vec2.0和CTC架构,支持中文语音识别。
语音识别
中文
A
speechbrain
36
9
Faster Whisper Large Zh Cv11
这是jonatasgrosman/whisper-large-zh-cv11模型的CTranslate2转换版本,用于高效语音识别任务,特别优化了中文语音识别能力。
语音识别
中文
F
arc-r
22
9
Whisper Tiny Zh
Apache-2.0
基于openai/whisper-tiny微调的中文语音识别模型,在Common Voice 11.0中文数据集上训练
语音识别
Transformers
中文
W
xmzhu
245
10
Whisper Large Zh Cv11
Apache-2.0
基于openai/whisper-large-v2在中文(普通话)上使用Common Voice 11数据集微调的语音识别模型
语音识别
Transformers
中文
W
jonatasgrosman
145
76
Wav2vec2 Large Chinese Zh Cn
Apache-2.0
基于XLSR-53大模型微调的中文语音识别模型,支持16kHz采样率的语音输入
语音识别
Transformers
中文
W
wbbbbb
585
40
Exp W2v2t Zh Cn Wavlm S596
Apache-2.0
基于microsoft/wavlm-large模型微调的中文语音识别模型,支持简体中文,使用Common Voice 7.0 (zh-CN)数据集训练。
语音识别
Transformers
E
jonatasgrosman
22
1
Stt Zh Citrinet 1024 Gamma 0 25
这是一个用于中文普通话自动语音识别(ASR)的非自回归Citrinet模型,拥有约1.4亿参数,采用字符编码方案和CTC损失/解码。
语音识别
中文
S
nvidia
92
5
Wav2vec2 Large Xlsr 53 Chinese Zn Cn Aishell1
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在中文AISHELL-1数据集上微调的语音识别模型,支持中文语音识别任务。
语音识别
Transformers
中文
W
qinyue
22
6
Wav2vec2 Base MIR ST500 ASR 109
Apache-2.0
基于facebook/wav2vec2-base在MIR_ST500数据集上微调的自动语音识别模型
语音识别
Transformers
W
gary109
15
0
Wav2vec2 Large Xlsr 53 Chinese Zh Cn
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的中文语音识别模型,支持16kHz采样率的语音输入。
语音识别
中文
W
jonatasgrosman
3.8M
110
Wav2vec2 Large Xlsr 53 Chinese Zh Cn Gpt
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在中文(zh-CN)上使用Common Voice数据集进行微调的语音识别模型
语音识别
Transformers
中文
W
ydshieh
127
32