Whisper Small Vi
MIT
基于openai/whisper-small针对越南语语音数据微调的自动语音识别模型,提升越南语转录准确性和鲁棒性
语音识别
Transformers

其他
W
namphungdn134
334
2
Faster Distil Whisper Large V3.5
MIT
Distil-Whisper是Whisper模型的蒸馏版本,针对自动语音识别(ASR)任务进行了优化,提供更快的推理速度。
语音识别
英语
F
Purfview
565
2
Whisper Large V3 Turbo Gguf
MIT
Whisper large-v3-turbo 是基于 Whisper large-v3 的剪枝微调版本,解码层数从32减少到4,速度大幅提升但质量略有下降。
语音识别
支持多种语言
W
xkeyC
546
1
Whisper Base Vi
MIT
基于openai/whisper-base模型在100小时越南语语音数据上微调的语音识别模型,提升越南语转录准确性
语音识别
Transformers

其他
W
namphungdn134
215
3
Distil Large V3.5 Ct2
MIT
Distil-Whisper是Whisper模型的蒸馏版本,通过大规模伪标签技术实现高效语音识别
语音识别
英语
D
distil-whisper
264
3
Whisper Small Sinhala
Apache-2.0
基于OpenAI Whisper-small微调的僧伽罗语语音识别模型
语音识别
Transformers

其他
W
Lingalingeswaran
667
2
Moonshine Base ONNX
MIT
基于Moonshine基础模型的ONNX格式自动语音识别模型,支持高效推理
语音识别
Transformers

M
onnx-community
1,171
29
Whisper Large V3 Distil Multi4 V0.2
MIT
这是一个多语言蒸馏版的Whisper模型,具有2个解码器层,支持4种欧洲语言:英语、法语、西班牙语和德语。
语音识别
Transformers

支持多种语言
W
bofenghuang
70
1
Whisper Medium Vaani Telugu
MIT
基于OpenAI Whisper-small架构的泰卢固语自动语音识别模型,由ARTPARK-IISc团队针对印度语言优化
语音识别
其他
W
ARTPARK-IISc
26
1
Moonshine Base
MIT
Moonshine是由Useful Sensors开发的自动语音识别(ASR)模型系列,专为英文语音转录设计,在资源受限平台上表现优异。
语音识别
Transformers

英语
M
UsefulSensors
6,857
32
Moonshine Tiny
MIT
月光模型是由Useful Sensors开发的自动语音识别(ASR)模型,专注于在资源受限设备上实现高效的英语语音转录。
语音识别
Transformers

英语
M
UsefulSensors
7,848
16
Whisper Base
Whisper是一个自动语音识别(ASR)系统,由OpenAI训练,支持多语言语音转录。
语音识别
Transformers

W
onnx-community
5,704
19
Faster Distil Whisper Large V3
MIT
Whisper Large v3的蒸馏版本,用于高效自动语音识别(ASR)
语音识别
英语
F
Systran
18.55k
49
Distil Whisper Large V3
Apache-2.0
该模型是从GGML格式的distil-whisper/distil-large-v3-ggml转换至Ratchet自定义格式的版本,主要用于语音识别任务。
语音识别
D
FL33TW00D-HF
164
4
Distil Large V3 Ct2
MIT
Distil-Whisper是Whisper模型的蒸馏版本,针对长文本转录进行了优化,提供更快的推理速度和更高的词错误率(WER)性能。
语音识别
英语
D
distil-whisper
58
6
Distil Medium.en
MIT
Distil-Whisper是Whisper模型的蒸馏版本,速度比原版快6倍,体积缩小49%,在英语语音识别任务上保持接近原版的性能。
语音识别
英语
D
distil-whisper
186.85k
120
Whisper Small Ml
Apache-2.0
该模型是基于openai/whisper-small微调的语音识别模型,支持多种语言,适用于自动语音识别任务。
语音识别
Transformers

W
kavyamanohar
23
2
Whisper Small Turkish Tr Best
Apache-2.0
基于OpenAI Whisper-small微调的土耳其语语音识别模型,词错误率26.34%
语音识别
Transformers

W
erenfazlioglu
61
4
Whisper Medium
Whisper Medium 是 OpenAI 开发的中等规模语音识别模型,支持多种语言的自动语音识别(ASR)任务。
语音识别
Transformers

W
Xenova
871
4
Whisper Small
Whisper Small 是 OpenAI 开发的一个小型自动语音识别(ASR)模型,能够将语音转换为文本。
语音识别
Transformers

W
Xenova
1,716
9
Whisper Base
Whisper是一个自动语音识别(ASR)系统,由OpenAI训练,支持多种语言的语音转文本任务。
语音识别
Transformers

W
Xenova
6,204
7
Wav2vec2 Base 960h Finetuned Common Voice3
Apache-2.0
基于facebook/wav2vec2-base-960h微调的语音识别模型,适用于通用语音识别任务
语音识别
Transformers

W
obokkkk
20
0
Waynehills STT Doogie Server
Apache-2.0
基于Doogie/Waynehills-STT-doogie-server微调的语音识别模型
语音识别
Transformers

W
Waynehillsdev
28
0
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文