长音频处理
Whisper Large V3 Turbo
MIT
Whisper是OpenAI开发的最先进的自动语音识别(ASR)和语音翻译模型,在超过500万小时的标记数据上训练,具有强大的零样本泛化能力。
语音识别
Transformers
支持多种语言
W
unsloth
94
1
Whisper Large V3
Apache-2.0
Whisper是OpenAI开发的最先进的自动语音识别(ASR)和语音翻译模型,支持多种语言
语音识别
Safetensors
支持多种语言
W
unsloth
4,002
1
Aero 1 Audio
MIT
轻量级音频模型,擅长语音识别、音频理解及执行音频指令等多元任务
音频生成文本
Transformers
英语
A
lmms-lab
1,348
74
Quantum STT
Apache-2.0
Quantum_STT 是一种先进的自动语音识别(ASR)和语音翻译模型,基于大规模弱监督训练,支持多种语言和任务。
语音识别
Transformers
支持多种语言
Q
sbapan41
100
1
Whisper Large V3 Turbo Gguf
MIT
Whisper large-v3-turbo 是基于 Whisper large-v3 的剪枝微调版本,解码层数从32减少到4,速度大幅提升但质量略有下降。
语音识别
支持多种语言
W
xkeyC
546
1
Whisper Large V3 Vaani Hindi
Apache-2.0
基于OpenAI的Whisper-Large-V3模型微调的印地语语音识别模型,训练数据包含约718小时的印地语转录语音
语音识别
Safetensors
W
ARTPARK-IISc
15.55k
3
Whisper Small Tel
Apache-2.0
基于OpenAI Whisper-large-v2在泰卢固语音频数据集上微调的语音识别模型
语音识别
Transformers
其他
W
sagarchapara
17
1
Whisper Large V3 Turbo
MIT
Whisper large-v3-turbo 是 OpenAI 提出的自动语音识别和语音翻译模型,基于大规模弱监督训练,支持多种语言。
语音识别
Transformers
支持多种语言
W
Daemontatox
26
1
Chunkformer Large Vie
基于ChunkFormer架构的大规模越南语自动语音识别模型,在约3000小时的越南语公开语音数据上微调,性能优异。
语音识别
其他
C
khanhld
1,765
12
Distil Large V3.5
MIT
Distil-Whisper是OpenAI Whisper-Large-v3的知识蒸馏版本,通过大规模伪标签训练实现高效语音识别。
语音识别
Transformers
英语
D
distil-whisper
4,804
25
Whisper Large V3 Turbo Common Voice 19 0 Zh TW
MIT
基于OpenAI Whisper-large-v3-turbo微调的繁体中文(台湾)自动语音识别模型
语音识别
Transformers
中文
W
JacobLinCool
220
4
Whisper Large V3 Turbo Turkish
MIT
基于openai/whisper-large-v3-turbo在Common Voice 17.0数据集上微调的土耳其语语音识别模型
语音识别
Transformers
其他
W
selimc
289
6
Whisper Large V3 Turbo
Apache-2.0
Whisper large-v3-turbo是OpenAI Whisper large-v3的蒸馏版本,解码层从32层减少到4层,速度大幅提升但质量略有下降。
语音识别
支持多种语言
W
deepdml
883
6
Whisper Large V3 Turbo
MIT
Whisper是由OpenAI开发的最先进的自动语音识别(ASR)和语音翻译模型,经过超过500万小时标记数据的训练,在零样本设置下展现出强大的泛化能力。
语音识别
Transformers
支持多种语言
W
openai
4.0M
2,317
Kotoba Whisper V2.0 Faster
MIT
适用于CTranslate2的Whisper语音识别模型,专为日语优化,提供高效的语音转文本功能。
语音识别
日语
K
kotoba-tech
202
14
Faster Whisper Large V3 Ru Podlodka Int8
Apache-2.0
这是基于OpenAI Whisper架构的俄语语音识别模型,专为俄语语音转文本任务优化,并转换为ctranslate2格式以提高推理效率。
语音识别
其他
F
bzikst
29
3
Audio Transcribe
这是一个基于Transformers的自动语音识别(ASR)模型,用于将音频文件转录为文本。
语音识别
A
washeed
257
4
Distil Small.en
MIT
Distil-Whisper是Whisper模型的蒸馏版本,速度快6倍,体积缩小49%,在非分布评估集上表现接近1% WER。
语音识别
Transformers
英语
D
distil-whisper
33.51k
97
Whisper Large V3 German
Apache-2.0
基于Whisper Large v3的德语语音识别微调模型,针对德语语音处理和识别进行了优化
语音识别
Transformers
德语
W
primeline
8,745
70
Whisper Large V3
Apache-2.0
Whisper是由OpenAI提出的先进自动语音识别(ASR)和语音翻译模型,在超过500万小时的标注数据上训练,具有强大的跨数据集和跨领域泛化能力。
语音识别
支持多种语言
W
openai
4.6M
4,321
Distil Medium.en
MIT
Distil-Whisper是Whisper模型的蒸馏版本,速度比原版快6倍,体积缩小49%,在英语语音识别任务上保持接近原版的性能。
语音识别
英语
D
distil-whisper
186.85k
120
Distil Large V2
MIT
Distil-Whisper是Whisper模型的蒸馏版本,速度提升6倍,体积缩小49%,在非分布评估集上的表现仅相差1% WER。
语音识别
英语
D
distil-whisper
42.65k
508
Whisper Tamil Large V2
Apache-2.0
基于OpenAI Whisper-large-v2微调的泰米尔语语音识别模型,在多个公开泰米尔语ASR语料库上训练
语音识别
其他
W
vasista22
325
7
Whisper Medium.en
Apache-2.0
Whisper是OpenAI开发的自动语音识别(ASR)模型,经过68万小时标注语音数据训练,具有强大的泛化能力。
语音识别
英语
W
openai
36.92k
53
Wav2vec2 Large Xls R 300m Bg
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在Common Voice 8保加利亚语数据集上微调的自动语音识别模型
语音识别
Transformers
其他
W
anuragshas
1,469
0