Lite Whisper Large V3 Turbo
Apache-2.0
Lite-Whisper 是采用 LiteASR 技术压缩的 OpenAI Whisper 轻量版,在保持较高准确率的同时显著减小模型大小。
语音识别
Transformers
L
efficient-speech
516
8
Whisper Small El
Apache-2.0
这是一个基于openai/whisper-small模型在希腊语语音识别任务上微调的自动语音识别(ASR)模型,使用Mozilla Common Voice 17.0数据集中的3620个希腊语样本进行训练。
语音识别
Transformers
其他
W
mozilla-ai
94
1
XLSR WithLM Malayalam
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在IMaSC、Indic TTS Malayalam和OpenSLR Malayalam训练集数据集上微调得到的版本,支持马拉雅拉姆语自动语音识别。
语音识别
Transformers
X
kavyamanohar
19
4
Whisper Small Sk Cv11
Apache-2.0
基于OpenAI Whisper-small微调的斯洛伐克语语音识别模型,在Common Voice 11.0斯洛伐克语数据集上训练
语音识别
Transformers
其他
W
mikr
79
2
Wav2vec2 2
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在评估集上词错误率(WER)为0.8133
语音识别
Transformers
W
chrisvinsen
16
0
Wav2vec2 Base Demo Colab
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音识别模型,在评估集上取得了31.42%的词错误率
语音识别
Transformers
W
brever
16
0
English Filipino Wav2vec2 L Xls R Test 04
Apache-2.0
该模型是基于jonatasgrosman/wav2vec2-large-xlsr-53-english在filipino_voice数据集上微调的版本,用于英语-菲律宾语语音识别任务。
语音识别
Transformers
E
Khalsuu
21
0
English Filipino Wav2vec2 L Xls R Test
Apache-2.0
基于jonatasgrosman/wav2vec2-large-xlsr-53-english微调的英语-菲律宾语语音识别模型
语音识别
Transformers
E
Khalsuu
18
0
Wav2vec2 Base Timit Demo
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在TIMIT数据集上取得28.25%的词错误率
语音识别
Transformers
W
dlu66061
21
0
Wav2vec2 Child En Tokenizer 4
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m微调的版本,专注于英语儿童语音识别任务。
语音识别
Transformers
W
jaeyeon
16
1
Wav2vec2 Base Toy Train Data Random Low Pass
Apache-2.0
该模型是基于facebook/wav2vec2-base在未知数据集上微调的语音识别模型,主要用于自动语音识别(ASR)任务。
语音识别
Transformers
W
scasutt
29
0
Wav2vec2 Large Xlsr 53 Toy Train Data Masked Audio 10ms
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53微调的语音识别模型,在10ms音频掩码训练数据上优化
语音识别
Transformers
W
scasutt
22
0
Wav2vec2 Base Toy Train Data Random Noise 0.1
Apache-2.0
基于facebook/wav2vec2-base模型在随机噪声数据集上微调的语音识别模型
语音识别
Transformers
W
scasutt
22
0
Xls R Ab Test
该模型是在Common Voice 7.0 AB数据集上微调的自动语音识别模型,基于XLS-R dummy架构
语音识别
Transformers
其他
X
cahya
20
0
Wav2vec2 Large Xlsr 53 Hsb
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的上索布语语音识别模型,支持16kHz音频输入
语音识别
其他
W
anuragshas
23
0
Wav2vec2 Base Timit Demo Colab 32 Epochs30
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在TIMIT数据集上训练30轮次
语音识别
Transformers
W
ying-tina
22
0
Wav2vec2 Xlsr Breton
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-1b在布列塔尼语数据集上微调的自动语音识别模型。
语音识别
Transformers
其他
W
sammy786
13
0
Wav2vec2 Large Xlsr Turkish Demo Colab
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在通用语音数据集上微调的土耳其语语音识别模型
语音识别
Transformers
W
patrickvonplaten
14
2
Wav2vec2 Base Demo Colab
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在特定数据集上训练,词错误率(WER)为0.3391。
语音识别
Transformers
W
asakawa
24
0
Wav2vec2 Xls R 300m Gn Cv8
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在Common Voice 8数据集上微调的自动语音识别(ASR)模型,支持瓜拉尼语(gn)。
语音识别
Transformers
其他
W
lgris
16
0
Sew Tiny Portuguese Cv8
Apache-2.0
这是一个基于SEW-tiny架构的葡萄牙语自动语音识别模型,在Common Voice 8数据集上微调,适用于葡萄牙语语音识别任务。
语音识别
Transformers
其他
S
lgris
16
0
Wav2vec2 Xls R 300m Italian Robust
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在多个意大利语语音数据集上微调的自动语音识别模型
语音识别
Transformers
其他
W
dbdmg
28
0
Wav2vec2 Base Demo Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base进行微调的语音识别模型,在Colab环境下训练完成
语音识别
Transformers
W
thyagosme
20
0
Xls R Kyrgiz Cv8
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在Common Voice 8.0吉尔吉斯语数据集上微调的自动语音识别模型
语音识别
Transformers
其他
X
lucio
16
0
Wav2vec2 Xls R 300m Wolof Lm
MIT
这是一个基于facebook/wav2vec2-xls-r-300m微调的沃洛夫语自动语音识别模型,旨在解决沃洛夫语资源匮乏的问题。
语音识别
Transformers
其他
W
abdouaziiz
41
4
Wav2vec2 Random
基于TIMIT_ASR数据集对wav2vec2-base-random模型进行微调的自动语音识别模型
语音识别
Transformers
W
patrickvonplaten
16
0
Wav2vec2 Xls R 300m Gl CV8
Apache-2.0
该模型是基于Facebook的wav2vec2-xls-r-300m在Common Voice加利西亚语(gl)数据集上微调的语音识别模型,在测试集上取得了20.8%的词错误率(WER)。
语音识别
Transformers
其他
W
emre
18
0
Wav2vec2 Georgian Daytona
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的格鲁吉亚语语音识别模型,在通用语音数据集上训练
语音识别
其他
W
Temur
19
2
Wav2vec2 Large Xls R 300m Hsb V1
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m在上索布语(HSB)数据集上微调的自动语音识别模型,在Common Voice 8测试集上取得了0.4393的词错误率(WER)。
语音识别
Transformers
其他
W
DrishtiSharma
20
0
Wav2vec2 Xls R 300m German De
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - DE数据集上微调的德语自动语音识别模型。
语音识别
Transformers
德语
W
AndrewMcDowell
72
3
Wav2vec2 Large Xls R 300m Br D10
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m在布列塔尼语数据集上微调的语音识别模型,在Common Voice 8测试集上取得了52.3%的词错误率(WER)。
语音识别
Transformers
其他
W
DrishtiSharma
21
0