多场景语音转写
Whisper Fa Tinyyy
MIT
基于OpenAI Whisper-tiny微调的波斯语自动语音识别模型,在common_voice_11_0数据集上训练
语音识别
Transformers
其他
W
hackergeek98
55
2
Whisper Large V3 Turbo Es
MIT
基于Whisper-large-v3-turbo微调的西班牙语语音识别模型,在Common Voice 17.0西班牙语数据集上词错误率降低至5.34%
语音识别
Transformers
西班牙语
W
adriszmar
52
4
Whisper Large V3 Turkish Test1
Apache-2.0
基于OpenAI Whisper-large-v3模型在Common Voice 17.0土耳其语数据集上微调的语音识别模型
语音识别
Transformers
其他
W
erdiyalcin
21
3
Whisper Small Sinhala Fine Tune
Apache-2.0
基于OpenAI Whisper-small模型在僧伽罗语上进行微调的语音识别模型
语音识别
Transformers
W
Subhaka
78
6
Whisper Medium Et
基于约800小时多样化爱沙尼亚语数据微调的Whisper-medium模型,适用于通用语音识别场景
语音识别
Transformers
W
TalTechNLP
115
2
Whisper Medium Turkish 2
Apache-2.0
基于OpenAI Whisper Medium微调的土耳其语语音识别模型,在Common Voice 11.0数据集上训练
语音识别
Transformers
其他
W
emre
267
15
Whisper Large V2 Serbian
Apache-2.0
这是基于OpenAI Whisper Large-V2模型在塞尔维亚语Common Voice 11.0数据集上微调的语音识别模型,词错误率为10.76%。
语音识别
Transformers
其他
W
DrishtiSharma
39
3
Exp W2v2t Fa Hubert S801
Apache-2.0
基于facebook/hubert-large-ll60k模型微调的波斯语自动语音识别模型,使用Common Voice 7.0波斯语数据集训练。
语音识别
Transformers
其他
E
jonatasgrosman
16
0
Exp W2v2t Sv Se Vp Nl S842
Apache-2.0
这是一个基于facebook/wav2vec2-large-nl-voxpopuli模型微调的瑞典语自动语音识别模型,使用Common Voice 7.0 (sv-SE)数据集进行训练。
语音识别
Transformers
E
jonatasgrosman
16
0
Wav2vec2 Large Xls R 300m Pt Colab
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_9_0数据集上微调的语音识别模型,支持葡萄牙语语音转文本任务。
语音识别
Transformers
W
robertodtg
107
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的土耳其语语音识别模型
语音识别
Transformers
W
pinot
16
0
W2v Xls R Uk
Apache-2.0
基于facebook/wav2vec2-xls-r-300m的乌克兰语自动语音识别模型,在Common Voice 10.0数据集上训练
语音识别
Transformers
其他
W
Yehor
231.46k
8
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的土耳其语语音识别模型
语音识别
Transformers
W
bansals10
23
0
Wav2vec2 Large Xls R 300m Russian Colab Beam Search Test
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的俄语语音识别模型,在评估集上取得了0.468的词错误率。
语音识别
Transformers
W
jfealko
18
0
Wav2vec2 Large Xlsr Greek 1
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在希腊语上微调的语音识别模型,支持16kHz采样率的语音输入。
语音识别
Transformers
其他
W
skylord
15
0
Wav2vec2 Xlsr Georgian
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-1b在格鲁吉亚语数据集上微调的自动语音识别模型
语音识别
Transformers
其他
W
sammy786
19
1
Wav2vec2 Large Nl Voxpopuli
基于VoxPopuli语料库荷兰语子集预训练的自动语音识别模型
语音识别
其他
W
facebook
18
0
Wav2vec2 Base Sv Voxpopuli
基于VoxPopuli语料库瑞典语子集预训练的Wav2Vec2基础模型,适用于瑞典语语音识别任务。
语音识别
Transformers
其他
W
facebook
33
0
Wav2vec2 Base Turkish Cv8
这是一个基于Common Voice 8.0土耳其语数据集微调的自动语音识别(ASR)模型,能够将土耳其语语音转换为文本。
语音识别
Transformers
其他
W
cahya
16
1
Wav2vec2 Large Xls R 300m Spanish Custom
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在common_voice西班牙语数据集上微调的语音识别模型,在评估集上取得了21.17%的词错误率。
语音识别
Transformers
W
tomascufaro
15
0
Wav2vec2 Common Voice Tr Demo
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在COMMON_VOICE SV-SE数据集上微调的自动语音识别(ASR)模型,支持瑞典语语音识别。
语音识别
Transformers
W
birgermoell
17
0
Wav2vec2 Large Xls R 300m Ur
Apache-2.0
基于wav2vec2-large-xls-r-300m架构的乌尔都语语音识别模型,在common_voice数据集上微调
语音识别
Transformers
W
anuragshas
20
0
Wav2vec2 Xlsr Estonian
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-1b模型在爱沙尼亚语数据集上微调的自动语音识别模型。
语音识别
Transformers
其他
W
sammy786
21
1
Wav2vec2 Base It Voxpopuli
基于VoxPopuli意大利语无标注数据预训练的Wav2Vec2基础模型,适用于语音识别任务。
语音识别
Transformers
其他
W
facebook
32
0
Wav2vec2 Large Xlsr 53 Dutch
Apache-2.0
Facebook开发的基于Wav2Vec 2.0架构的荷兰语自动语音识别(ASR)模型,采用XLSR-53多语言预训练模型微调
语音识别
其他
W
facebook
203
2
Wav2vec2 Xls R 300m Uk
MIT
这是一个基于facebook/wav2vec2-xls-r-300m模型在乌克兰语数据集上微调的自动语音识别(ASR)模型,在Common Voice乌克兰语测试集上取得了12.22%的词错误率(WER)。
语音识别
Transformers
其他
W
robinhad
72
5
Xlsr Fa Lm
基于通用语音波斯语数据微调的XLS-R-300m语音识别模型
语音识别
Transformers
其他
X
manifoldix
16
1
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在common_voice土耳其语数据集上微调的语音识别模型
语音识别
Transformers
W
chaitanya97
23
0
Wav2vec2 Large Xls R 300m Urdu
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在Common Voice 8乌尔都语数据集上微调的语音识别模型
语音识别
Transformers
其他
W
kingabzpro
91.36k
13
Wav2vec2 Large Xls R 300m Basque
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在巴斯克语Common Voice数据集上微调的自动语音识别模型
语音识别
Transformers
其他
W
deepdml
31
0
Wav2vec2 Large Xls R 300m Latvian
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m在拉脱维亚语数据集上微调的自动语音识别模型,在Common Voice 7测试集上取得了16.98%的WER。
语音识别
Transformers
其他
W
infinitejoy
222
1
Wav2vec2 Large Xls R 300m Bulgarian
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - BG数据集上微调的保加利亚语语音识别模型
语音识别
Transformers
其他
W
infinitejoy
10.59k
2
Wav2vec2 Large Xlsr 53 Portuguese
Apache-2.0
Facebook开发的基于Wav2Vec 2.0架构的大规模葡萄牙语自动语音识别(ASR)模型,支持葡萄牙语语音转文本任务。
语音识别
其他
W
facebook
425
6
Xls Npsc Oh
该模型是基于KBLab/wav2vec2-large-voxrex在NBAILAB/NPSC - 48K_MP3数据集上微调的自动语音识别模型
语音识别
Transformers
X
NbAiLab
30
0
Wav2vec2 Common Voice Nl Demo
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型在荷兰语COMMON_VOICE数据集上微调的自动语音识别(ASR)模型。
语音识别
Transformers
其他
W
MatsUy
16
0
Wav2vec2 Large Xls R 300m Sl With LM V2
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m在斯洛文尼亚语(common_voice_8_0)数据集上微调的自动语音识别(ASR)模型,支持语言模型(LM)增强。
语音识别
Transformers
其他
W
DrishtiSharma
26
0
Wav2vec2 Large Xlsr 53 Frisian
Apache-2.0
这是一个基于wav2vec2-large-xlsr-53模型微调的弗里斯兰语自动语音识别(ASR)模型,由RuudVelo开发。
语音识别
W
RuudVelo
31
0
Wav2vec2 Large Xls R 300m Hsb V1
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m在上索布语(HSB)数据集上微调的自动语音识别模型,在Common Voice 8测试集上取得了0.4393的词错误率(WER)。
语音识别
Transformers
其他
W
DrishtiSharma
20
0
Wav2vec2 Xls R 300m Cv8 Turkish
Apache-2.0
这是一个基于Facebook的wav2vec2-xls-r-300m模型在土耳其语Common Voice 8数据集上微调的自动语音识别(ASR)模型。
语音识别
Transformers
其他
W
Baybars
16
0
Wav2vec2 Large Xls R 300m Bg V1
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在保加利亚语语音数据集上微调的自动语音识别(ASR)模型。
语音识别
Transformers
其他
W
DrishtiSharma
16
1