多方言适配
Whisper Large V3 French Distil Dec16 Ct2
MIT
这是Whisper Large V3的法语蒸馏版本,专为法语自动语音识别优化,通过ctranslate2实现高效推理。
语音识别
法语
W
Kelno
35
1
Whisper Small Ta
Apache-2.0
该模型是基于OpenAI的Whisper Small在泰米尔语Common Voice 17.0数据集上微调的语音识别模型,词错误率(WER)为43.23%。
语音识别
Transformers
其他
W
navin-kumar-j
38
1
Whisper Tamil Large V2
Apache-2.0
基于OpenAI Whisper-large-v2微调的泰米尔语语音识别模型,在多个公开泰米尔语ASR语料库上训练
语音识别
其他
W
vasista22
325
7
Uzbek Stt
Apache-2.0
由Oyqiz团队开发的乌兹别克语自动语音识别(ASR)模型,基于Common Voice 10.0数据集训练
语音识别
Transformers
其他
U
oyqiz
425
5
Wav2vec2 Large Xls R 300m Singlish Colab
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在新加坡英语(li_singlish)数据集上微调的语音识别模型
语音识别
Transformers
W
RuiqianLi
22
1
Wav2vec2 Urdu
Apache-2.0
基于wav2vec2架构的乌尔都语自动语音识别模型,在Common Voice数据集上微调
语音识别
Transformers
其他
W
kingabzpro
101
3
Wav2vec2 Xls R 300m Gn Cv8
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在Common Voice 8数据集上微调的自动语音识别(ASR)模型,支持瓜拉尼语(gn)。
语音识别
Transformers
其他
W
lgris
16
0
Wav2vec2 Large Xlsr 53 Tatar
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在鞑靼语上微调的自动语音识别模型,支持16kHz采样率的语音输入。
语音识别
其他
W
crang
163
1
Wav2vec2 Xls R Urdu
Apache-2.0
该模型是基于Facebook的Wav2Vec2-Large-XLSR-53在乌尔都语Common Voice数据集上微调的自动语音识别(ASR)模型
语音识别
Transformers
其他
W
Maniac
22
1
Xls R 300m Ur Cv8 Hi
Apache-2.0
这是一个基于wav2vec2架构的乌尔都语自动语音识别模型,在Common Voice 8.0乌尔都语数据集上微调
语音识别
Transformers
其他
X
HarrisDePerceptron
16
0
Swahili Xlsr
Apache-2.0
基于facebook/wav2vec2-xls-r-300m微调的斯瓦希里语自动语音识别模型,在Common Voice 8数据集上训练
语音识别
Transformers
其他
S
Akashpb13
26
8