低词错误率

# 低词错误率

Breeze ASR 25 是一款基于 Whisper-large-v2 微调的先进自动语音识别模型，特别优化了台湾普通话和普通话-英语代码切换场景的识别能力。

Safetensors 支持多种语言

MediaTek-Research

Phi 4 Mm Inst Asr Singlish

针对新加坡英语优化的多模态语音识别模型，基于微软Phi-4多模态指令模型微调，显著提升对新加坡英语独特语音特征的识别能力。

音频生成文本

Transformers 支持多种语言

Wav2vec2 Base Librispeech Demo Colab

该模型是基于facebook/wav2vec2-base在LibriSpeech数据集上微调的语音识别模型，在评估集上取得了0.3174的词错误率。

Hubert Base Librispeech Demo Colab

基于facebook/hubert-large-ls960-ft微调的语音识别模型，在LibriSpeech数据集上训练

Whisper Small Vi

基于openai/whisper-small针对越南语语音数据微调的自动语音识别模型，提升越南语转录准确性和鲁棒性

Transformers 其他

Whisper Large V3 French Distil Dec16 Ct2

这是Whisper Large V3的法语蒸馏版本，专为法语自动语音识别优化，通过ctranslate2实现高效推理。

语音识别法语

W2v Bert 2.0 Naijavoices Clearglobal Hausa 500hr V0

基于facebook/w2v-bert-2.0微调的豪萨语语音识别模型，在500小时豪萨语数据上训练，词错误率7.47%

Whisper Persian Turbooo

基于OpenAI Whisper-large-v3-turbo优化的波斯语自动语音识别模型，支持医疗领域应用

Transformers 其他

Whisper Base Vi

基于openai/whisper-base模型在100小时越南语语音数据上微调的语音识别模型，提升越南语转录准确性

Transformers 其他

Whisper Large V3 Persian Common Voice 17

基于Whisper Large v3微调的波斯语自动语音识别模型，使用Common Voice 17数据集训练，显著提升了波斯语识别准确率。

Transformers 其他

Whisper Large V3 Vaani Hindi

基于OpenAI的Whisper-Large-V3模型微调的印地语语音识别模型，训练数据包含约718小时的印地语转录语音

Indian Accent English Whisper Finetuned Epoch 15

基于OpenAI Whisper-large-v3-turbo微调的印度英语口音语音识别模型，在印度英语口音数据集上取得7.99%的词错误率

Transformers 英语

Wav2vec2 Large Xlsr 53 Hungarian

基于facebook/wav2vec2-large-xlsr-53在匈牙利语Common Voice数据集上微调的自动语音识别模型

Transformers 其他

Whisper Small Fr

这是一个基于法语数据集微调的Whisper-small语音识别模型，词错误率相比基线模型降低了6.793个百分点。

Transformers 法语

Lite Whisper Large V3 Turbo Acc

Lite-Whisper 是采用 LiteASR 技术压缩的 OpenAI Whisper 轻量版本，在保持高准确率的同时减小模型大小。

efficient-speech

基于OpenAI Whisper Medium模型微调的乌兹别克语自动语音识别模型

Transformers 其他

Whisper Finetuned

基于Whisper-large-v3-turbo微调的印度英语口音语音识别模型，词错误率4.39%

Transformers 英语

Kb Whisper Small

瑞典国家图书馆发布的Whisper模型，专为瑞典语优化，在50,000+小时瑞典语音数据上训练，性能超越OpenAI原版

Transformers 其他

Kb Whisper Medium

瑞典国家图书馆发布的基于超过5万小时瑞典语音训练的Whisper模型，在瑞典语音识别任务上表现优异

Transformers 其他

Kb Whisper Large

瑞典国家图书馆发布的基于Whisper架构的瑞典语语音识别模型，训练数据超过5万小时，显著降低词错误率。

Transformers 其他

Quran Whisper Base Fine Tune

该模型是基于openai/whisper-base在quran-ayat-speech-to-text数据集上微调的阿拉伯语语音识别模型，专注于古兰经经文的语音转文字任务。

Transformers 阿拉伯语

Whisper Large V3 Turbo STT Zeroth KO V2

基于Whisper Large v3 Turbo优化的韩语自动语音识别模型，提供高准确率且带时间戳的转写结果

Transformers 韩语

Chunkformer Large Vie

基于ChunkFormer架构的大规模越南语自动语音识别模型，在约3000小时的越南语公开语音数据上微调，性能优异。

语音识别其他

Whisper Finetuned Amharic

基于openai/whisper-small微调的阿姆哈拉语语音识别模型，在评估集上词错误率为2.0538%

Wav2vec2 Large Xls R 300m Ru

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_17_0数据集上微调的俄语自动语音识别(ASR)模型，词错误率(WER)为0.195。

Whisper Small Tajik

基于OpenAI Whisper-small微调的塔吉克语自动语音识别模型，在Google Fleurs数据集上训练，词错误率24.26%。

Transformers 其他

Audiox South V1

AudioX是由Jivi AI开发的多语言自动语音识别模型，专门针对印度南方语言优化，支持泰米尔语、泰卢固语、卡纳达语和马拉雅拉姆语。

语音识别其他

Whisper Large V3 Turbo Shqip

基于OpenAI Whisper Large v3 Turbo针对阿尔巴尼亚语优化的语音识别模型，支持标准阿尔巴尼亚语及盖格方言

Transformers 其他

Whisper Small For Quran

基于OpenAI Whisper-small微调的古兰经语音识别模型，专为阿拉伯语古兰经音频设计

Transformers 阿拉伯语

German RAG WHISPER LARGE V3 TURBO HESSIAN AI

基于Whisper Large v3 Turbo优化的德语语音识别模型，在13小时精选数据集上微调，显著提升德语识别准确率

Transformers 德语

基于Whisper Base微调的乌兹别克语语音识别模型，在Common Voice数据集上训练

Transformers 其他

Whisper Khanacademy Large V3 Turbo Tr

基于OpenAI Whisper-large-v3-turbo模型在土耳其语可汗学院数据集上微调的自动语音识别(ASR)模型

Transformers 其他

Voice Clone Large Finetune Final

该模型是基于openai/whisper-large-v3微调的语音克隆模型，主要用于语音识别任务，在评估集上词错误率为15.3572。

Whisper Tiny German 1224

基于Whisper架构优化的德语语音识别模型，参数量3900万，支持高效德语语音转录

Transformers 德语

Whisper Large V3 Turbo German Ct2

基于 Whisper Large v3 的德语语音识别模型，专为德语语音处理和识别优化

Transformers 德语

Whisper Large V3 Turbo Common Voice 19 0 Zh TW

基于OpenAI Whisper-large-v3-turbo微调的繁体中文（台湾）自动语音识别模型

Transformers 中文

Pathumma Whisper Th Large V3

Pathumma Whisper Large V3 是一个基于 OpenAI Whisper 架构的泰语自动语音识别模型，支持泰语和英语的语音转录任务。

Transformers 支持多种语言

Whisper Large V3 Lv Late Cv19

基于whisper-large-v3微调的拉脱维亚语自动语音识别模型，由AiLab.lv训练，支持拉脱维亚语语音转文本任务。

语音识别其他

Whisper Base Hungarian V1

基于OpenAI Whisper-base模型微调的匈牙利语语音识别模型，在1200小时匈牙利语数据上训练，表现优于同类模型

Transformers 其他

Whisper Large V3 Turbo Turkish

基于openai/whisper-large-v3-turbo在Common Voice 17.0数据集上微调的土耳其语语音识别模型

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24