通用语音数据集
Wav2vec2 Base Cv 10000
Apache-2.0
基于wav2vec2-base-cv在通用语音数据集上微调的语音识别模型,在评估集上取得了36.84%的词错误率。
语音识别
Transformers
W
jiobiala24
28
0
Wav2vec2 Large Xlsr Mongolian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在通用语音数据集上对蒙古语进行微调的自动语音识别模型
语音识别
Transformers
其他
W
sammy786
22
0
Wav2vec2 Large Xlsr Portuguese
Apache-2.0
基于Facebook的wav2vec2-large-xlsr-53架构微调的葡萄牙语自动语音识别模型,在通用语音数据集上训练,词错误率13.77%。
语音识别
其他
W
joaoalvarenga
83
0
Wav2vec2 Xls R 300m Hy AM CV8 V1
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的语音识别模型
语音识别
Transformers
W
emre
17
0
Wav2vec2 Large Xlsr 53 Hsb
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的上索布语语音识别模型,支持16kHz音频输入
语音识别
其他
W
anuragshas
23
0
Wav2vec2 Xls R 300m Zh CN
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集ZH-CN上微调的自动语音识别(ASR)模型,支持中文普通话识别。
语音识别
Transformers
其他
W
anantoj
37
0
Wav2vec2 Large Xls R 300m Spanish Small
基于wav2vec2-large-xls-r-300m架构的西班牙语语音识别模型,在通用语音数据集上微调,词错误率(WER)为0.1791
语音识别
Transformers
W
tomascufaro
13
0
Wav2vec2 Xls R 300m Es
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在COMMON_VOICE - ES数据集上微调的西班牙语自动语音识别模型。
语音识别
Transformers
西班牙语
W
samitizerxu
23
0
Wav2vec2 Large Xlsr Luganda
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的卢干达语语音识别模型,在通用语音数据集上训练,词错误率29.52%
语音识别
其他
W
lucio
17
1
Wav2vec2 Large Xls R 300m Spanish Small
这是一个基于wav2vec2架构的西班牙语语音识别模型,在通用语音数据集上进行了微调,词错误率(WER)为0.2105。
语音识别
Transformers
W
glob-asr
58
0
Wav2vec Tr Lite AG
Apache-2.0
这是一个基于XLSR Wav2Vec2架构的土耳其语自动语音识别模型,在通用语音土耳其语数据集上训练
语音识别
其他
W
emre
26
0
Wav2vec2 Large Xlsr Finnish
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53在芬兰语上微调的自动语音识别模型,使用通用语音数据集进行训练。
语音识别
其他
W
birgermoell
22
0
Wav2vec2 Large Xlsr 53 Vietnamese
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的越南语自动语音识别模型,使用通用语音数据集训练。
语音识别
其他
W
anuragshas
279
2
Wav2vec2 Large Xlsr Frisian
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型在弗里斯兰语上进行微调的自动语音识别模型,使用通用语音数据集训练。
语音识别
W
iarfmoose
170
0
Wav2vec2 10july
Apache-2.0
这是一个基于XLSR Wav2Vec2架构的德语自动语音识别模型,在通用语音德语数据集上进行了微调。
语音识别
Transformers
德语
W
sourabharsh
24
0
Wav2vec2 Large Xlsr Swedish
Apache-2.0
这是一个基于XLSR-53架构的瑞典语自动语音识别模型,在通用语音数据集上进行微调。
语音识别
其他
W
marma
24
0
Wav2vec2 Cv Coral 30ep
Apache-2.0
基于Facebook的wav2vec2-large-xlsr-53模型微调的葡萄牙语语音识别模型,在通用语音数据集上训练
语音识别
其他
W
joaoalvarenga
27
1
Xlsr Wav2vec English
Apache-2.0
基于facebook/wav2vec2-large在通用语音数据集上进行英语微调的自动语音识别模型,支持16kHz采样率的语音输入。
语音识别
Transformers
英语
X
harshit345
27
0
Common6
基于COMMON_VOICE - FA数据集微调的波斯语自动语音识别模型
语音识别
Transformers
其他
C
ghofrani
23
0
Wav2vec2 Large Xlsr 53 Sah CV8
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在通用语音雅库特语数据集上微调的语音识别模型
语音识别
Transformers
其他
W
emre
19
0
Wav2vec2 Large Xlrs Estonian
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型在爱沙尼亚语通用语音数据集上微调的自动语音识别(ASR)模型。
语音识别
其他
W
birgermoell
18
0
Wav2vec2 Base Checkpoint 14
Apache-2.0
基于wav2vec2架构的语音识别模型,在通用语音数据集上微调
语音识别
Transformers
W
jiobiala24
16
0
Base Spanish Asr
基于通用语音数据集训练的西班牙语语音识别模型,采用wav2vec2架构
语音识别
Transformers
B
glob-asr
19
0
Wav2vec2 Xls R 300m Urdu
Facebook的3亿参数语音识别模型,针对乌尔都语进行微调,基于通用语音8.0乌尔都语数据集训练
语音识别
Transformers
W
aasem
16
1
Wav2vec2 Large Xlsr Punjabi
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型在旁遮普语语音数据上微调的自动语音识别(ASR)模型。
语音识别
W
manandey
20.46k
1
Wav2vec2 Large Xlsr Mongolian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在蒙古语通用语音数据集上微调的自动语音识别模型
语音识别
其他
W
manandey
4,719
0
Wav2vec2 Xlsr Multilingual 56
Apache-2.0
这是一个支持56种语言的多语言自动语音识别(ASR)模型,基于facebook/wav2vec2-large-xlsr-53在通用语音数据集上微调而成。
语音识别
Transformers
支持多种语言
W
voidful
21.69k
30
Wav2vec2 Large Xlsr 53 Chuvash
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的楚瓦什语自动语音识别模型,在通用语音数据集上训练,词错误率为40.01%。
语音识别
其他
W
anton-l
30
0
Wav2vec2 Large Xlsr Kinyarwanda Apostrophied
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在卢旺达语上的微调模型,支持预测标记代词与元音开头单词缩写的撇号
语音识别
其他
W
lucio
28
2
Wav2vec2 Large Xlsr Hu
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型微调的匈牙利语自动语音识别(ASR)模型,使用通用语音数据集训练。
语音识别
其他
W
gchhablani
25
0
Wav2vec2 Xlsr Punjabi
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型,使用通用语音数据集对旁遮普语进行微调的自动语音识别模型
语音识别
W
gagan3012
2,433
0
Wav2vec2 Large Xls R 300m Greek
基于通用语音数据集训练的希腊语语音识别模型,采用wav2vec2架构
语音识别
Transformers
W
jerrychatz
19
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的土耳其语语音识别模型
语音识别
Transformers
W
BSen
17
0