高效语音识别
Faster Distil Whisper Large V3.5
MIT
Distil-Whisper是Whisper模型的蒸馏版本,针对自动语音识别(ASR)任务进行了优化,提供更快的推理速度。
语音识别
英语
F
Purfview
565
2
Faster Distil Whisper Large V3.5
MIT
基于Distil-Whisper large-v3.5转换的CTranslate2格式模型,用于高效语音识别
语音识别
英语
F
deepdml
58.15k
2
Distil Large V3.5 ONNX
MIT
Distil-Whisper是OpenAI Whisper-Large-v3的知识蒸馏版本,提供更优的性能表现和高效性。
语音识别
Transformers
英语
D
distil-whisper
25
1
Distil Large V3.5 Ct2
MIT
Distil-Whisper是Whisper模型的蒸馏版本,通过大规模伪标签技术实现高效语音识别
语音识别
英语
D
distil-whisper
264
3
Distil Large V3.5
MIT
Distil-Whisper是OpenAI Whisper-Large-v3的知识蒸馏版本,通过大规模伪标签训练实现高效语音识别。
语音识别
Transformers
英语
D
distil-whisper
4,804
25
Faster Whisper V2 D4
Apache-2.0
这是一个基于Whisper模型优化的希伯来语和英语语音识别模型,由ivrit.ai开发。
语音识别
支持多种语言
F
ivrit-ai
696
16
Distil Large V3
MIT
Distil-Whisper是Whisper large-v3的知识蒸馏版本,专注于英语自动语音识别,提供更快的推理速度同时保持接近原始模型的准确性。
语音识别
英语
D
distil-whisper
417.11k
311
Parakeet Tdt 1.1b
Parakeet TDT 1.1B是由NVIDIA NeMo和Suno.ai联合开发的自动语音识别(ASR)模型,能够将语音转录为小写英文字母。
语音识别
英语
P
nvidia
12.27k
90
Faster Distil Whisper Medium.en
MIT
这是distil-whisper/distil-medium.en模型转换为CTranslate2格式的版本,用于高效语音识别任务。
语音识别
英语
F
Systran
6,155
4
Faster Distil Whisper Large V2
MIT
这是一个基于Whisper架构的蒸馏版本自动语音识别(ASR)模型,专为高效推理设计,适用于英语语音转文本任务。
语音识别
英语
F
Systran
1,336
19
Sew D Tiny 100k Ft Ls100h
Apache-2.0
SEW-D-tiny 是由 ASAPP Research 开发的高效语音识别预训练模型,专注于性能和效率的平衡。
语音识别
Transformers
英语
S
asapp
24.55k
2
Sew D Mid 400k Ft Ls100h
Apache-2.0
SEW-D-mid是由ASAPP Research开发的语音预训练模型,专注于自动语音识别任务,在性能和效率之间取得了良好平衡。
语音识别
Transformers
英语
S
asapp
20
1
Sew Tiny 100k
Apache-2.0
SEW-tiny是由ASAPP Research开发的压缩高效型语音预训练模型,基于16kHz采样的语音音频进行预训练,适用于多种下游语音任务。
语音识别
Transformers
支持多种语言
S
asapp
1,080
3
Sew D Mid K127 400k Ft Ls100h
Apache-2.0
SEW-D-mid-k127是由ASAPP Research开发的高效语音识别预训练模型,在性能和效率方面相比wav2vec 2.0有显著改进。
语音识别
Transformers
英语
S
asapp
16
0
Sew D Base Plus 400k Ft Ls100h
Apache-2.0
SEW-D-base+ 是由 ASAPP Research 开发的高效语音识别模型,基于 16kHz 采样的语音音频进行预训练,在 LibriSpeech 数据集上表现出色。
语音识别
Transformers
英语
S
asapp
66
4
Sew Tiny 100k Ft Ls100h
Apache-2.0
SEW(压缩高效版Wav2vec)是由ASAPP Research开发的语音识别预训练模型,在性能和效率上优于wav2vec 2.0
语音识别
Transformers
支持多种语言
S
asapp
736
1