低资源语言ASR

# 低资源语言ASR

Whisper Kurmanji

针对库尔德语库尔曼吉方言的自动语音识别模型，基于Whisper架构微调

Safetensors 其他

Akan Whisper Model

基于OpenAI Whisper模型微调的版本，专为加纳低资源语言阿坎语的自动语音识别任务设计

Transformers 其他

Whisper Medium Aeb ENT

基于openai/whisper-medium在AT_ENT数据集上微调的阿拉伯语（突尼斯方言）语音识别模型

Transformers 其他

Whisper Medium Darija

基于openai/whisper-medium在达里贾方言语音转文本数据集上微调的语音识别模型

Transformers 其他

Indicconformer Stt Ur Hybrid Ctc Rnnt Large

IndicConformer 是一个基于混合 CTC-RNNT 架构的 Conformer 自动语音识别模型，专门用于乌尔都语语音转录。

语音识别其他

Indicconformer Stt As Hybrid Ctc Rnnt Large

IndicConformer 是一个基于混合 CTC-RNNT 架构的 Conformer 自动语音识别（ASR）模型，支持阿萨姆语语音转录。

语音识别其他

Wav2vec2 Large Xls R 300m Amharic Demo Colab

基于facebook/wav2vec2-xls-r-300m在common_voice_16_1数据集上微调的阿姆哈拉语语音识别模型

Akylai STT Small

吉尔吉斯语Whisper ASR是一款专为吉尔吉斯语定制的自动语音识别解决方案，基于预训练的Whisper模型微调适配。

Transformers 其他

the-cramer-project

Whisper Large Sme

基于Whisper-large-v2微调的北萨米语语音识别模型，在测试集上词错误率为24.91%

Transformers 其他

Whisper Small Pashto

基于OpenAI Whisper-small微调的普什图语(ps)语音识别模型，在FLEURS数据集上训练

Transformers 其他

Asr Wav2vec2 Dvoice Darija

这是一个针对摩洛哥阿拉伯语方言(Darija)的自动语音识别模型，基于wav2vec 2.0架构在DVoice数据集上微调训练而成。

语音识别其他

My Final Wav2vec2 Urdu Asr Project

这是一个基于wav2vec2架构的乌尔都语自动语音识别(ASR)模型，从头开始训练。

Wav2vec2 Large Xlsr 53 Dhivehi V2

基于facebook/wav2vec2-large-xlsr-53模型，使用普通语音的迪维希语数据进行了微调的自动语音识别模型。

Transformers 其他

Wav2vec2 Xls R 300m Ab CV8

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的版本，用于阿布哈兹语的自动语音识别任务。

Transformers 其他

Wav2vec2 Large Xlsr Kn

这是一个基于Facebook的wav2vec2-large-xlsr-53模型在卡纳达语上进行微调的自动语音识别(ASR)模型，使用OpenSLR SLR79数据集训练。

语音识别其他

Wav2vec2 Large Xlsr Persian

基于facebook/wav2vec2-large-xlsr-53在波斯语（Farsi）上微调的自动语音识别模型，支持16kHz采样率的语音输入。

语音识别其他

Wav2vec2 Xls R 300m Gn Cv8 4

这是一个基于facebook/wav2vec2-xls-r-300m模型在Common Voice 8.0数据集上微调的自动语音识别(ASR)模型，专门针对瓜拉尼语(gn)优化。

Transformers 其他

Wav2vec2 Large Xlsr 53 Dhivehi

基于facebook/wav2vec2-large-xlsr-53模型微调的迪维希语自动语音识别模型，词错误率(WER)为32.85%。

Transformers 其他

Wav2vec2 Large Xlsr 53 Odia

基于facebook/wav2vec2-large-xlsr-53微调的奥里亚语自动语音识别模型，使用低资源印度语言挑战赛数据训练

Transformers 其他

Wav2vec2 Large Xlsr Cnh

基于facebook/wav2vec2-large-xlsr-53模型微调的哈卡钦语语音识别模型，在通用语音数据集上训练，测试WER为31.38%。

语音识别其他

Wav2vec2 Large Xls R 300m Kyrgyz

这是一个基于facebook/wav2vec2-xls-r-300m模型在吉尔吉斯语语音数据集上微调的自动语音识别(ASR)模型

Transformers 其他

Wav2vec2 Large Xlsr Bengali

基于 facebook/wav2vec2-large-xlsr-53 微调的孟加拉语自动语音识别模型，使用 OpenSLR 数据集中的4万条语音训练

语音识别其他

Wav2vec2 Xls R 300m Wolof Lm

这是一个基于facebook/wav2vec2-xls-r-300m微调的沃洛夫语自动语音识别模型，旨在解决沃洛夫语资源匮乏的问题。

Transformers 其他

这是一个基于XLS-R架构在Common Voice阿布哈兹语(ab)数据集上微调的自动语音识别模型

Transformers 其他

Wav2vec2 Large Xlsr Mr 3

这是一个基于facebook/wav2vec2-large-xlsr-53模型微调的马拉地语自动语音识别(ASR)模型，使用OpenSLR和InterSpeech 2021数据集训练。

语音识别其他

Wav2vec2 Xls R 300m Gn Cv8 3

基于facebook/wav2vec2-xls-r-300m模型在瓜拉尼语(gn)Common Voice 8.0数据集上微调的自动语音识别(ASR)模型

Transformers 其他

Wav2vec2 Large Xls R 300m Kurdish

这是一个基于facebook/wav2vec2-xls-r-300m在库尔曼吉库尔德语数据集上微调的自动语音识别(ASR)模型。

Transformers 其他

Wav2vec2 Large Xlsr 53 Telugu

基于facebook/wav2vec2-large-xlsr-53模型微调的泰卢固语语音识别模型，使用OpenSLR SLR66数据集训练

语音识别其他

Wav2vec2 Large Xlsr Breton

基于facebook/wav2vec2-large-xlsr-53在布列塔尼语Common Voice数据集上微调的语音识别模型

语音识别其他

Wav2vec2 Large Xls R 300m Sakha

基于facebook/wav2vec2-xls-r-300m在雅库特语(SAH)数据集上微调的自动语音识别模型

Transformers 其他

Wav2vec2 Xlsr Chuvash

基于facebook/wav2vec2-large-xlsr-53在楚瓦什语上的微调模型，用于自动语音识别任务。

语音识别其他

Wav2vec2 Large Xls R 300m Ha Cv8

基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的豪萨语语音识别模型

Transformers 其他

Wav2vec2 Xls R Myv A1

该模型是基于facebook/wav2vec2-xls-r-300m在Erzya语言(MYV)数据集上微调的自动语音识别(ASR)模型，在Common Voice 8测试集上取得了65.15%的词错误率(WER)。

Transformers 其他

Wav2vec2 Large Xls R 300m Hsb V3

基于facebook/wav2vec2-xls-r-300m在上索布语(hsb)数据集上微调的自动语音识别模型

Transformers 其他

Wav2vec2 Large Xls R 300m Hsb V1

这是一个基于facebook/wav2vec2-xls-r-300m在上索布语(HSB)数据集上微调的自动语音识别模型，在Common Voice 8测试集上取得了0.4393的词错误率(WER)。

Transformers 其他

Wav2vec2 Large Xls R 300m Gn K1

该模型是基于Facebook的wav2vec2-xls-r-300m模型，在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - GN数据集上进行微调的自动语音识别模型，支持瓜拉尼语(gn)。

Transformers 其他

Wav2vec2 Xls R 300m Pa IN R5

这是一个基于facebook/wav2vec2-xls-r-300m模型在旁遮普语(印度)数据集上微调的自动语音识别模型。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24