Phi 4 Mm Inst Asr Singlish
MIT
针对新加坡英语优化的多模态语音识别模型,基于微软Phi-4多模态指令模型微调,显著提升对新加坡英语独特语音特征的识别能力。
音频生成文本
Transformers

支持多种语言
P
mjwong
61
0
Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在LibriSpeech数据集上微调的语音识别模型,在评估集上取得了0.3174的词错误率。
语音识别
Transformers

W
vishwasgautam
14
0
Hubert Base Librispeech Demo Colab
Apache-2.0
基于facebook/hubert-large-ls960-ft微调的语音识别模型,在LibriSpeech数据集上训练
语音识别
Transformers

H
vishwasgautam
101
0
Whisper Small Vi
MIT
基于openai/whisper-small针对越南语语音数据微调的自动语音识别模型,提升越南语转录准确性和鲁棒性
语音识别
Transformers

其他
W
namphungdn134
334
2
Whisper Large V3 French Distil Dec16 Ct2
MIT
这是Whisper Large V3的法语蒸馏版本,专为法语自动语音识别优化,通过ctranslate2实现高效推理。
语音识别
法语
W
Kelno
35
1
W2v Bert 2.0 Naijavoices Clearglobal Hausa 500hr V0
MIT
基于facebook/w2v-bert-2.0微调的豪萨语语音识别模型,在500小时豪萨语数据上训练,词错误率7.47%
语音识别
Transformers

W
asr-africa
16
1
Whisper Persian Turbooo
MIT
基于OpenAI Whisper-large-v3-turbo优化的波斯语自动语音识别模型,支持医疗领域应用
语音识别
Transformers

其他
W
hackergeek98
51
2
Whisper Base Vi
MIT
基于openai/whisper-base模型在100小时越南语语音数据上微调的语音识别模型,提升越南语转录准确性
语音识别
Transformers

其他
W
namphungdn134
215
3
Whisper Large V3 Persian Common Voice 17
MIT
基于Whisper Large v3微调的波斯语自动语音识别模型,使用Common Voice 17数据集训练,显著提升了波斯语识别准确率。
语音识别
Transformers

其他
W
msghol
442
2
Whisper Large V3 Vaani Hindi
Apache-2.0
基于OpenAI的Whisper-Large-V3模型微调的印地语语音识别模型,训练数据包含约718小时的印地语转录语音
语音识别
Safetensors
W
ARTPARK-IISc
15.55k
3
Indian Accent English Whisper Finetuned Epoch 15
MIT
基于OpenAI Whisper-large-v3-turbo微调的印度英语口音语音识别模型,在印度英语口音数据集上取得7.99%的词错误率
语音识别
Transformers

英语
I
Tejveer12
21
2
Wav2vec2 Large Xlsr 53 Hungarian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在匈牙利语Common Voice数据集上微调的自动语音识别模型
语音识别
Transformers

其他
W
sarpba
17
1
Whisper Small Fr
Apache-2.0
这是一个基于法语数据集微调的Whisper-small语音识别模型,词错误率相比基线模型降低了6.793个百分点。
语音识别
Transformers

法语
W
mozilla-ai
30
1
Lite Whisper Large V3 Turbo Acc
Apache-2.0
Lite-Whisper 是采用 LiteASR 技术压缩的 OpenAI Whisper 轻量版本,在保持高准确率的同时减小模型大小。
语音识别
Transformers

L
efficient-speech
7,414
7
Whisper Uz
Apache-2.0
基于OpenAI Whisper Medium模型微调的乌兹别克语自动语音识别模型
语音识别
Transformers

其他
W
mustafoyev202
110
1
Whisper Finetuned
MIT
基于Whisper-large-v3-turbo微调的印度英语口音语音识别模型,词错误率4.39%
语音识别
Transformers

英语
W
Tejveer12
25
2
Kb Whisper Small
Apache-2.0
瑞典国家图书馆发布的Whisper模型,专为瑞典语优化,在50,000+小时瑞典语音数据上训练,性能超越OpenAI原版
语音识别
Transformers

其他
K
KBLab
28.61k
3
Kb Whisper Medium
Apache-2.0
瑞典国家图书馆发布的基于超过5万小时瑞典语音训练的Whisper模型,在瑞典语音识别任务上表现优异
语音识别
Transformers

其他
K
KBLab
691
3
Kb Whisper Large
Apache-2.0
瑞典国家图书馆发布的基于Whisper架构的瑞典语语音识别模型,训练数据超过5万小时,显著降低词错误率。
语音识别
Transformers

其他
K
KBLab
8,880
42
Quran Whisper Base Fine Tune
Apache-2.0
该模型是基于openai/whisper-base在quran-ayat-speech-to-text数据集上微调的阿拉伯语语音识别模型,专注于古兰经经文的语音转文字任务。
语音识别
Transformers

阿拉伯语
Q
Baselhany
35
1
Whisper Large V3 Turbo STT Zeroth KO V2
基于Whisper Large v3 Turbo优化的韩语自动语音识别模型,提供高准确率且带时间戳的转写结果
语音识别
Transformers

韩语
W
o0dimplz0o
662
3
Chunkformer Large Vie
基于ChunkFormer架构的大规模越南语自动语音识别模型,在约3000小时的越南语公开语音数据上微调,性能优异。
语音识别
其他
C
khanhld
1,765
12
Whisper Finetuned Amharic
Apache-2.0
基于openai/whisper-small微调的阿姆哈拉语语音识别模型,在评估集上词错误率为2.0538%
语音识别
Transformers

W
seyyaw
57
1
Wav2vec2 Large Xls R 300m Ru
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_17_0数据集上微调的俄语自动语音识别(ASR)模型,词错误率(WER)为0.195。
语音识别
Transformers

W
NLPVladimir
56
1
Whisper Small Tajik
Apache-2.0
基于OpenAI Whisper-small微调的塔吉克语自动语音识别模型,在Google Fleurs数据集上训练,词错误率24.26%。
语音识别
Transformers

其他
W
abduaziz
25
1
Audiox South V1
Apache-2.0
AudioX是由Jivi AI开发的多语言自动语音识别模型,专门针对印度南方语言优化,支持泰米尔语、泰卢固语、卡纳达语和马拉雅拉姆语。
语音识别
其他
A
jiviai
148
1
Whisper Large V3 Turbo Shqip
MIT
基于OpenAI Whisper Large v3 Turbo针对阿尔巴尼亚语优化的语音识别模型,支持标准阿尔巴尼亚语及盖格方言
语音识别
Transformers

其他
W
Kushtrim
143
4
Whisper Small For Quran
Apache-2.0
基于OpenAI Whisper-small微调的古兰经语音识别模型,专为阿拉伯语古兰经音频设计
语音识别
Transformers

阿拉伯语
W
areaz
26
2
German RAG WHISPER LARGE V3 TURBO HESSIAN AI
MIT
基于Whisper Large v3 Turbo优化的德语语音识别模型,在13小时精选数据集上微调,显著提升德语识别准确率
语音识别
Transformers

德语
G
avemio
282
1
Whisper Uz
Apache-2.0
基于Whisper Base微调的乌兹别克语语音识别模型,在Common Voice数据集上训练
语音识别
Transformers

其他
W
jamshidahmadov
1,179
3
Whisper Khanacademy Large V3 Turbo Tr
MIT
基于OpenAI Whisper-large-v3-turbo模型在土耳其语可汗学院数据集上微调的自动语音识别(ASR)模型
语音识别
Transformers

其他
W
ysdede
31
1
Voice Clone Large Finetune Final
Apache-2.0
该模型是基于openai/whisper-large-v3微调的语音克隆模型,主要用于语音识别任务,在评估集上词错误率为15.3572。
语音识别
Transformers

V
neuronbit
37
2
Whisper Tiny German 1224
Apache-2.0
基于Whisper架构优化的德语语音识别模型,参数量3900万,支持高效德语语音转录
语音识别
Transformers

德语
W
primeline
322
9
Whisper Large V3 Turbo German Ct2
Apache-2.0
基于 Whisper Large v3 的德语语音识别模型,专为德语语音处理和识别优化
语音识别
Transformers

德语
W
jimmymeister
38
3
Whisper Large V3 Turbo Common Voice 19 0 Zh TW
MIT
基于OpenAI Whisper-large-v3-turbo微调的繁体中文(台湾)自动语音识别模型
语音识别
Transformers

中文
W
JacobLinCool
220
4
Pathumma Whisper Th Large V3
Apache-2.0
Pathumma Whisper Large V3 是一个基于 OpenAI Whisper 架构的泰语自动语音识别模型,支持泰语和英语的语音转录任务。
语音识别
Transformers

支持多种语言
P
nectec
352
4
Whisper Large V3 Lv Late Cv19
Apache-2.0
基于whisper-large-v3微调的拉脱维亚语自动语音识别模型,由AiLab.lv训练,支持拉脱维亚语语音转文本任务。
语音识别
其他
W
AiLab-IMCS-UL
162
1
Whisper Base Hungarian V1
基于OpenAI Whisper-base模型微调的匈牙利语语音识别模型,在1200小时匈牙利语数据上训练,表现优于同类模型
语音识别
Transformers

其他
W
sarpba
26
7
Whisper Large V3 Turbo Turkish
MIT
基于openai/whisper-large-v3-turbo在Common Voice 17.0数据集上微调的土耳其语语音识别模型
语音识别
Transformers

其他
W
selimc
289
6
Whisper Large V3 Turbo Es
MIT
基于Whisper-large-v3-turbo微调的西班牙语语音识别模型,在Common Voice 17.0西班牙语数据集上词错误率降低至5.34%
语音识别
Transformers

西班牙语
W
adriszmar
52
4
- 1
- 2
- 3
- 4
- 5
- 6
- 10
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文