16kHz采样率适配
Exp W2v2t Sv Se R Wav2vec2 S418
Apache-2.0
基于facebook/wav2vec2-large-robust模型微调的瑞典语自动语音识别模型,支持16kHz采样率语音输入。
语音识别
Transformers
E
jonatasgrosman
32
0
Exp W2v2t It Vp Fr S821
Apache-2.0
基于facebook/wav2vec2-large-fr-voxpopuli模型微调的意大利语自动语音识别模型,使用Common Voice 7.0意大利语数据集训练
语音识别
Transformers
其他
E
jonatasgrosman
27
0
Exp W2v2t It Wavlm S895
Apache-2.0
基于microsoft/wavlm-large模型微调的意大利语自动语音识别模型,使用Common Voice 7.0意大利语数据集训练。
语音识别
Transformers
其他
E
jonatasgrosman
42
0
Wav2vec2 Large Xlsr 53 Levantine Arabic
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型,在阿拉伯语音语料库数据集上微调的阿拉伯语语音识别模型
语音识别
阿拉伯语
W
elgeish
46
4
Wav2vec2 Large Xls Ar
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的阿拉伯语自动语音识别模型,在Common Voice阿拉伯语数据集上测试WER为52%。
语音识别
Transformers
阿拉伯语
W
mohamed1ai
30
1
Wav2vec2 Large Xlsr Estonian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在爱沙尼亚语Common Voice数据集上微调的自动语音识别模型
语音识别
其他
W
manandey
21
0
Wav2vec2 Large Robust Ft Libri 960h
Apache-2.0
该模型是Facebook Wav2Vec2的微调版本,专注于语音识别任务,在多种语音数据上预训练并在Librispeech上微调,具有鲁棒性强的特点。
语音识别
Transformers
英语
W
facebook
161.65k
15
Wav2vec2 Large Xlsr 53 Ukrainian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在乌克兰语上使用Common Voice数据集进行微调的自动语音识别模型
语音识别
其他
W
mrm8488
25
1
Wav2vec2 Large Xlsr 53 Euskera
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型在巴斯克语(Euskera)上使用Common Voice数据集进行微调的语音识别模型。
语音识别
其他
W
mrm8488
28
0
Wav2vec2 Large Xlsr Arabic
Apache-2.0
针对阿拉伯语语音识别微调的Wav2Vec2-Large-XLSR-53大模型,基于Common Voice和Arabic Speech Corpus数据集训练
语音识别
阿拉伯语
W
mohammed
51
3
Wav2vec2 Large Xlsr Tamil
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的泰米尔语自动语音识别(ASR)模型
语音识别
其他
W
Thanish
86
0
Wav2vec2 Large Xlsr Arabic
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在阿拉伯语通用语音数据集上微调的语音识别模型
语音识别
Transformers
阿拉伯语
W
othrif
302
0
Vakyansh Wav2vec2 Hindi Him 4200
MIT
基于Wav2Vec2架构的印地语自动语音识别模型,由Harveen Chadha开发,在4200小时标注印地语数据上微调
语音识别
Transformers
其他
V
Harveenchadha
2,621
5
Wav2vec2 Base Voxpopuli Sv Swedish
基于Facebook的VoxPopuli-sv基础版模型,使用NST和Common Voice数据进行微调的瑞典语语音识别模型。
语音识别
Transformers
W
KBLab
38
0
Vakyansh Wav2vec2 Tamil Tam 250
MIT
基于Wav2Vec2架构的泰米尔语自动语音识别模型,由Harveen Chadha开发,在4200小时印地语数据上微调
语音识别
Transformers
其他
V
Harveenchadha
1,843
2
Vakyansh Wav2vec2 Punjabi Pam 10
MIT
基于CLSRIL-23多语言预训练模型微调的旁遮普语自动语音识别模型,支持16kHz采样率的语音输入。
语音识别
Transformers
其他
V
Harveenchadha
96
0