高精度WER
Wav2vec2 Large Xlrs Korean V5
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在zeroth_korean数据集上微调的韩语自动语音识别模型,词错误率为0.2433。
语音识别
Transformers
W
student-47
285
1
Stt Ru Fastconformer Hybrid Large Pc
这是一个用于俄语自动语音识别的FastConformer混合模型,结合了Transducer和CTC解码器,参数规模约1.15亿。
语音识别
其他
S
nvidia
6,513
10
Stt De Fastconformer Hybrid Large Pc
这是一个基于FastConformer架构的德语自动语音识别模型,采用转换器和CTC混合训练方式,参数规模约115M。
语音识别
德语
S
nvidia
1,017
4
Wav2vec2 Large Xlsr 53 Spanish Ep5 944h
适用于西班牙语自动语音识别的声学模型,基于facebook/wav2vec2-large-xlsr-53微调5个周期,使用约944小时西班牙语数据。
语音识别
Transformers
西班牙语
W
carlosdanielhernandezmena
111
3
Wav2vec2 Large Vi Vlsp2020
基于wav2vec2架构的越南语自动语音识别模型,预训练使用1.3万小时未标注YouTube音频,并在250小时标注数据上微调
语音识别
Transformers
其他
W
nguyenvulebinh
385
4
Stt Ru Conformer Ctc Large
这是一个用于俄语自动语音识别的大型Conformer-CTC模型,在约1636小时的俄语语音数据上训练,具有约1.2亿参数。
语音识别
其他
S
nvidia
452
5
Stt Es Conformer Ctc Large
这是一个用于西班牙语自动语音识别(ASR)的大型Conformer-CTC模型,由NVIDIA训练并发布。
语音识别
西班牙语
S
nvidia
59
2
Stt Fr Conformer Transducer Large
这是一个用于法语自动语音识别的大规模康福默-转换器模型,参数约1.2亿,在超过1500小时的法语语音数据上训练而成。
语音识别
法语
S
nvidia
31
10
Wav2vec2 Large 960h Lv60 Self 4 Gram Fine Tune Real 29 Jun
Apache-2.0
该模型是基于facebook/wav2vec2-large-960h-lv60-self在uob_singlish数据集上微调的语音识别模型,支持新加坡英语识别。
语音识别
Transformers
W
RuiqianLi
105
0
Stt Fr Conformer Ctc Large
这是一个基于Conformer架构的法语自动语音识别(ASR)大模型,采用CTC损失函数,在超过1500小时的法语语音数据上训练而成。
语音识别
法语
S
nvidia
361
6
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2数据集上微调的自动语音识别模型
语音识别
Transformers
A
gary109
40
0
Wav2vec2 Large Multilang Cv Ru
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice数据集上微调的版本,主要用于俄语语音识别任务。
语音识别
Transformers
W
cutten
16
0
Assignment1 Maria
MIT
s2t-small-librispeech-asr 是一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型,基于序列到序列的转换器架构。
语音识别
Transformers
英语
A
Classroom-workshop
23
0
Assignment1 Joane
MIT
一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型
语音识别
Transformers
英语
A
Classroom-workshop
22
0
Assignment1 Jack
MIT
一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型,基于序列到序列转换器架构
语音识别
Transformers
英语
A
Classroom-workshop
24
0
Assignment1 Jane
MIT
s2t-small-librispeech-asr 是一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型,基于序列到序列转换器架构。
语音识别
Transformers
英语
A
Classroom-workshop
29
0
Assignment1 Omar
Apache-2.0
Wav2Vec2是一个基于自监督学习的语音识别模型,在LibriSpeech 960小时语音数据上预训练和微调,支持英语语音转录。
语音识别
Transformers
英语
A
Classroom-workshop
28
0
Wav2vec2 Large Xls R 300m Singlish Colab
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在新加坡英语(li_singlish)数据集上微调的语音识别模型
语音识别
Transformers
W
RuiqianLi
22
1
Ai Light Dance Singing Ft Wav2vec2 Large Lv60 V2
Apache-2.0
该模型是基于wav2vec2-large-lv60在ONSET-SINGING数据集上微调的自动语音识别模型,专注于歌唱语音识别任务。
语音识别
Transformers
A
gary109
16
1
Dansk Wav2vec21
Apache-2.0
该模型是基于Siyam/SKYLy在common_voice数据集上微调得到的丹麦语语音识别模型
语音识别
Transformers
D
Siyam
32
0
English Filipino Wav2vec2 L Xls R Test 02
Apache-2.0
这是一个基于wav2vec2-large-xlsr-53-english模型在菲律宾语音数据集上微调的语音识别模型,支持英语和菲律宾语的语音转文本任务。
语音识别
Transformers
E
Khalsuu
21
0
Wav2vec2 Common Voice Lithuanian
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - LT数据集上微调的版本,用于立陶宛语语音识别。
语音识别
Transformers
其他
W
birgermoell
17
0
20220413 210552
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的语音识别模型
语音识别
Transformers
2
lilitket
18
0
Aradia Ctc Distilhubert Ft
Apache-2.0
基于distilhubert在阿拉伯语语音数据集上微调的自动语音识别(ASR)模型
语音识别
Transformers
A
abdusah
16
0
Wav2vec2 Large Xls R 300m Irish Colab Test
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在common_voice爱尔兰语数据集上微调的语音识别模型,主要用于爱尔兰语的自动语音识别任务。
语音识别
Transformers
W
jfealko
24
0
Wav2vec2 Xlsr Basaa
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-1b在Common Voice 8巴萨语数据集上微调得到的自动语音识别模型。
语音识别
Transformers
其他
W
sammy786
20
0
Wav2vec2 Xlsr Czech
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-1b在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - cs数据集上微调得到的捷克语自动语音识别模型。
语音识别
Transformers
其他
W
sammy786
21
0
Wav2vec2 Xls R 1b Portuguese CORAA 3
Apache-2.0
基于facebook/wav2vec2-xls-r-1b在CORAA数据集上微调的葡萄牙语自动语音识别模型
语音识别
Transformers
其他
W
lgris
31
0
Wav2vec2 Speechdat
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - SV-SE数据集上微调的瑞典语自动语音识别模型。
语音识别
Transformers
W
birgermoell
29
0
Wav2vec2 Xls R 1b Portuguese
Apache-2.0
这是一个基于XLS-R 1B架构的葡萄牙语自动语音识别模型,在多个葡萄牙语语音数据集上进行了微调。
语音识别
Transformers
其他
W
jonatasgrosman
648.50k
12
S2t Small Librispeech Asr
MIT
一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型,基于序列到序列转换器架构
语音识别
Transformers
英语
S
facebook
10.92k
27
Wav2vec2 Xls R Hindi
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m在印地语Common Voice 7.0数据集上微调的自动语音识别(ASR)模型
语音识别
Transformers
其他
W
shivam
19
1
Wav2vec2 Large Xlsr 53 Ir
Apache-2.0
基于wav2vec2-large-xlsr-53微调的爱尔兰盖尔语自动语音识别模型,在Common Voice 7.0数据集上训练
语音识别
Transformers
W
jcmc
24
0
Wav2vec2 Large Xls R 300m Hindi Colab
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的版本,用于印地语语音识别任务。
语音识别
Transformers
W
chaitanya97
19
0
Wav2vec2 Large Xls R 300m Ur
Apache-2.0
基于wav2vec2-large-xls-r-300m架构的乌尔都语语音识别模型,在common_voice数据集上微调
语音识别
Transformers
W
anuragshas
20
0
Wav2vec2 Xls R 1b Italian
Apache-2.0
这是一个基于XLS-R 1B架构的意大利语自动语音识别模型,在多个意大利语数据集上进行了微调
语音识别
Transformers
其他
W
jonatasgrosman
2,703
1
Wav2vec2 Xls R 1b Russian
Apache-2.0
基于XLS-R 1B架构微调的俄语语音识别模型,在Common Voice 8.0等数据集上训练
语音识别
Transformers
其他
W
jonatasgrosman
765
14
Wav2vec2 Xl 960h Dementiabank
Apache-2.0
该模型是基于facebook/wav2vec2-large-960h在DementiaBank数据集上微调的语音识别模型,主要用于语音转文本任务。
语音识别
Transformers
W
shields
20
0
Wav2vec2 Large Xls R 300m Irish Colab
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的爱尔兰语语音识别模型
语音识别
Transformers
W
jimregan
15
0
Wav2vec2 Large Xls R 300m Odia Cv8
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在奥里亚语(OR)Common Voice数据集上微调的自动语音识别模型
语音识别
Transformers
其他
W
infinitejoy
16
0