Akan Whisper Model
基于OpenAI Whisper模型微调的版本,专为加纳低资源语言阿坎语的自动语音识别任务设计
语音识别
Transformers

其他
A
GiftMark
354
3
Whisper Medium Aeb ENT
Apache-2.0
基于openai/whisper-medium在AT_ENT数据集上微调的阿拉伯语(突尼斯方言)语音识别模型
语音识别
Transformers

其他
W
Rziane
15
1
Whisper Medium Darija
Apache-2.0
基于openai/whisper-medium在达里贾方言语音转文本数据集上微调的语音识别模型
语音识别
Transformers

其他
W
ychafiqui
169
5
Indicconformer Stt Ur Hybrid Ctc Rnnt Large
MIT
IndicConformer 是一个基于混合 CTC-RNNT 架构的 Conformer 自动语音识别模型,专门用于乌尔都语语音转录。
语音识别
其他
I
ai4bharat
44
2
Indicconformer Stt As Hybrid Ctc Rnnt Large
MIT
IndicConformer 是一个基于混合 CTC-RNNT 架构的 Conformer 自动语音识别(ASR)模型,支持阿萨姆语语音转录。
语音识别
其他
I
ai4bharat
101
3
Wav2vec2 Large Xls R 300m Amharic Demo Colab
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在common_voice_16_1数据集上微调的阿姆哈拉语语音识别模型
语音识别
Transformers

W
DipsankarSinha
18
2
Akylai STT Small
Apache-2.0
吉尔吉斯语Whisper ASR是一款专为吉尔吉斯语定制的自动语音识别解决方案,基于预训练的Whisper模型微调适配。
语音识别
Transformers

其他
A
the-cramer-project
73
1
Whisper Large Sme
Apache-2.0
基于Whisper-large-v2微调的北萨米语语音识别模型,在测试集上词错误率为24.91%
语音识别
Transformers

其他
W
NbAiLab
40
5
Whisper Small Pashto
Apache-2.0
基于OpenAI Whisper-small微调的普什图语(ps)语音识别模型,在FLEURS数据集上训练
语音识别
Transformers

其他
W
ihanif
18
1
Asr Wav2vec2 Dvoice Darija
Apache-2.0
这是一个针对摩洛哥阿拉伯语方言(Darija)的自动语音识别模型,基于wav2vec 2.0架构在DVoice数据集上微调训练而成。
语音识别
其他
A
speechbrain
120
11
My Final Wav2vec2 Urdu Asr Project
这是一个基于wav2vec2架构的乌尔都语自动语音识别(ASR)模型,从头开始训练。
语音识别
Transformers

M
Raffay
24
0
Wav2vec2 Large Xlsr 53 Dhivehi V2
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型,使用普通语音的迪维希语数据进行了微调的自动语音识别模型。
语音识别
Transformers

其他
W
shahukareem
31
3
Wav2vec2 Xls R 300m Ab CV8
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的版本,用于阿布哈兹语的自动语音识别任务。
语音识别
Transformers

其他
W
emre
20
0
Wav2vec2 Xls R 300m Gn Cv8 4
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在Common Voice 8.0数据集上微调的自动语音识别(ASR)模型,专门针对瓜拉尼语(gn)优化。
语音识别
Transformers

其他
W
lgris
17
0
Wav2vec2 Large Xlsr Persian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在波斯语(Farsi)上微调的自动语音识别模型,支持16kHz采样率的语音输入。
语音识别
其他
W
m3hrdadfi
562
16
Wav2vec2 Large Xlsr Kn
Apache-2.0
这是一个基于Facebook的wav2vec2-large-xlsr-53模型在卡纳达语上进行微调的自动语音识别(ASR)模型,使用OpenSLR SLR79数据集训练。
语音识别
其他
W
amoghsgopadi
2,200
1
Wav2vec2 Large Xlsr 53 Odia
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53微调的奥里亚语自动语音识别模型,使用低资源印度语言挑战赛数据训练
语音识别
Transformers

其他
W
theainerd
83
3
Wav2vec2 Large Xlsr 53 Dhivehi
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的迪维希语自动语音识别模型,词错误率(WER)为32.85%。
语音识别
Transformers

其他
W
shahukareem
20
1
Wav2vec2 Large Xlsr Cnh
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的哈卡钦语语音识别模型,在通用语音数据集上训练,测试WER为31.38%。
语音识别
其他
W
gchhablani
22
0
Wav2vec2 Large Xls R 300m Kyrgyz
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在吉尔吉斯语语音数据集上微调的自动语音识别(ASR)模型
语音识别
Transformers

其他
W
infinitejoy
17
0
Wav2vec2 Large Xlsr Mr 3
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型微调的马拉地语自动语音识别(ASR)模型,使用OpenSLR和InterSpeech 2021数据集训练。
语音识别
其他
W
gchhablani
22
0
Wav2vec2 Xls R 300m Wolof Lm
MIT
这是一个基于facebook/wav2vec2-xls-r-300m微调的沃洛夫语自动语音识别模型,旨在解决沃洛夫语资源匮乏的问题。
语音识别
Transformers

其他
W
abdouaziiz
41
4
Xls R Ab Test
这是一个基于XLS-R架构在Common Voice阿布哈兹语(ab)数据集上微调的自动语音识别模型
语音识别
Transformers

其他
X
baaastien
17
0
Wav2vec2 Large Xlsr Bengali
基于 facebook/wav2vec2-large-xlsr-53 微调的孟加拉语自动语音识别模型,使用 OpenSLR 数据集中的4万条语音训练
语音识别
其他
W
arijitx
758
6
Wav2vec2 Xls R 300m Gn Cv8 3
Apache-2.0
基于facebook/wav2vec2-xls-r-300m模型在瓜拉尼语(gn)Common Voice 8.0数据集上微调的自动语音识别(ASR)模型
语音识别
Transformers

其他
W
lgris
17
0
Wav2vec2 Large Xls R 300m Sakha
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在雅库特语(SAH)数据集上微调的自动语音识别模型
语音识别
Transformers

其他
W
infinitejoy
18
0
Wav2vec2 Large Xls R 300m Kurdish
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m在库尔曼吉库尔德语数据集上微调的自动语音识别(ASR)模型。
语音识别
Transformers

其他
W
infinitejoy
81
4
Wav2vec2 Xlsr Chuvash
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在楚瓦什语上的微调模型,用于自动语音识别任务。
语音识别
其他
W
gagan3012
54
0
Wav2vec2 Large Xlsr Breton
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在布列塔尼语Common Voice数据集上微调的语音识别模型
语音识别
其他
W
cahya
25
1
Wav2vec2 Large Xls R 300m Ha Cv8
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的豪萨语语音识别模型
语音识别
Transformers

其他
W
anuragshas
17
1
Wav2vec2 Large Xlsr 53 Telugu
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的泰卢固语语音识别模型,使用OpenSLR SLR66数据集训练
语音识别
其他
W
anuragshas
44.24k
5
Wav2vec2 Xls R Myv A1
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在Erzya语言(MYV)数据集上微调的自动语音识别(ASR)模型,在Common Voice 8测试集上取得了65.15%的词错误率(WER)。
语音识别
Transformers

其他
W
DrishtiSharma
24
0
Wav2vec2 Large Xls R 300m Hsb V3
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在上索布语(hsb)数据集上微调的自动语音识别模型
语音识别
Transformers

其他
W
DrishtiSharma
18
0
Wav2vec2 Large Xls R 300m Hsb V1
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m在上索布语(HSB)数据集上微调的自动语音识别模型,在Common Voice 8测试集上取得了0.4393的词错误率(WER)。
语音识别
Transformers

其他
W
DrishtiSharma
20
0
Wav2vec2 Large Xls R 300m Gn K1
Apache-2.0
该模型是基于Facebook的wav2vec2-xls-r-300m模型,在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - GN数据集上进行微调的自动语音识别模型,支持瓜拉尼语(gn)。
语音识别
Transformers

其他
W
DrishtiSharma
22
0
Wav2vec2 Xls R 300m Pa IN R5
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在旁遮普语(印度)数据集上微调的自动语音识别模型。
语音识别
Transformers

W
DrishtiSharma
25
0
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文