高精度语音转写
Whisper Medium Oswald
Apache-2.0
基于OpenAI Whisper-medium微调的海地克里奥尔语语音识别模型,专注高准确率转录
语音识别
Transformers
其他
W
jsbeaudry
102
1
Exp W2v2t It Wavlm S895
Apache-2.0
基于microsoft/wavlm-large模型微调的意大利语自动语音识别模型,使用Common Voice 7.0意大利语数据集训练。
语音识别
Transformers
其他
E
jonatasgrosman
42
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V3
基于wav2vec2-large-xlsr-53模型微调的自动语音识别模型,专注于歌唱语音识别
语音识别
Transformers
A
gary109
97
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V4 1
该模型是基于wav2vec2-large-xlsr-53架构的自动语音识别(ASR)模型,在GARY109/AI_LIGHT_DANCE - ONSET-SINGING2数据集上微调得到,主要用于歌唱语音识别任务。
语音识别
Transformers
A
gary109
66
1
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V5
Apache-2.0
基于wav2vec2-large-xlsr-53的自动语音识别模型,在GARY109/AI_LIGHT_DANCE数据集上微调
语音识别
Transformers
A
gary109
160
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice土耳其语数据集上微调的语音识别模型,在评估集上取得了32.08%的词错误率。
语音识别
Transformers
W
Samiul
99
0
Ai Light Dance Singing Ft Pretrain Wav2vec2 Large Lv60
该模型是基于wav2vec2-large-lv60架构的自动语音识别(ASR)模型,在GARY109/AI_LIGHT_DANCE - ONSET-SINGING数据集上微调得到,主要用于歌声识别任务。
语音识别
Transformers
A
gary109
22
0
Wav2vec2 Final 1 Lm 4
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在评估集上词错误率为0.4499
语音识别
Transformers
W
chrisvinsen
16
0
Wav2vec2 Large Xlsr 53 Tr Fine Tuning Deprecated
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice土耳其语数据集上微调的语音识别模型
语音识别
Transformers
W
bekirbakar
17
0
Wav2vec2 1b Npsc Nst Bokmaal
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-1b在挪威语Bokmål方言语音数据集上微调的自动语音识别(ASR)模型
语音识别
Transformers
W
NbAiLab
30
0
Aspram
Apache-2.0
基于wav2vec2-xls-r-2b架构的亚美尼亚语自动语音识别模型,支持hy/hye语言
语音识别
Transformers
其他
A
YSU
170
4
20220412 203254
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的语音识别模型,支持自动语音识别任务。
语音识别
Transformers
2
lilitket
18
0
Wav2vec2 Large 100h Lv60 Self
Apache-2.0
Wav2Vec2-Large-100h-Lv60是基于100小时Libri-Light和Librispeech语音数据预训练和微调的大模型,采用自训练目标训练,适用于16kHz采样率的语音识别任务。
语音识别
Transformers
英语
W
Splend1dchan
17
0
Wav2vec2 Large Xlsr 53 Ft Cgn
基于facebook/wav2vec2-large-xlsr-53大模型,通过CTC损失函数在荷兰语口语语料库上进行微调训练的荷兰语语音识别模型
语音识别
Transformers
其他
W
GroNLP
22
3
Wav2vec2 Dutch Large Ft Cgn
一款荷兰语Wav2Vec2模型,通过在荷兰语音库CGN上对原始英文模型进行持续预训练和微调构建。
语音识别
Transformers
其他
W
GroNLP
18
1
Wav2vec2 Large Xls R 300m Vietnamese Colab
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的越南语语音识别模型
语音识别
Transformers
W
Jungwonchang
22
0
Wav2vec2 2 Bart Large No Adapter
该模型是基于LibriSpeech ASR数据集训练的自动语音识别(ASR)模型,能够将英语语音转换为文本。
语音识别
Transformers
W
sanchit-gandhi
22
0
Wav2vec2 2 Bert Large No Adapter
基于LibriSpeech数据集训练的自动语音识别(ASR)模型,用于将英语语音转换为文本
语音识别
Transformers
W
speech-seq2seq
15
1
Wav2vec2 Large Xlsr 53 Levantine Arabic
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型,在阿拉伯语音语料库数据集上微调的阿拉伯语语音识别模型
语音识别
阿拉伯语
W
elgeish
46
4
Wav2vec2 Xlsr Tatar
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-1b在鞑靼语数据集上微调得到的自动语音识别模型,在Common Voice 8数据集上取得了16.87%的词错误率(WER)。
语音识别
Transformers
其他
W
sammy786
17
1
Wav2vec2 Xls R 300m Turkish Tr Med
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在常见语音数据集上微调的土耳其语语音识别模型
语音识别
Transformers
W
emre
22
0
Wav2vec2 Large Xlsr Persian V2
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在波斯语(波斯语)上使用Common Voice数据集进行微调的自动语音识别模型
语音识别
其他
W
m3hrdadfi
47
6
Wav2vec2 2 Bert Large No Adapter Frozen Enc
该模型是基于librispeech_asr数据集训练的语音识别模型,在评估集上取得了2.0133的词错误率(WER)。
语音识别
Transformers
W
speech-seq2seq
25
2
Wav2vec2 Common Voice Tr Demo
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型在COMMON_VOICE - TR土耳其语数据集上微调的自动语音识别(ASR)模型。
语音识别
Transformers
其他
W
shiyue
25
0
Wav2vec2 Xlsr Chuvash
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-1b在Common Voice 8楚瓦什语数据集上微调的自动语音识别模型
语音识别
Transformers
其他
W
sammy786
23
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的土耳其语语音识别模型。
语音识别
Transformers
W
masapasa
20
0
Wav2vec2 Large Xlsr Persian Shemo
Apache-2.0
基于Wav2Vec2-Large-XLSR-53在波斯语ShEMO数据集上微调的自动语音识别模型
语音识别
其他
W
m3hrdadfi
28
3
Wav2vec2 Large It Voxpopuli
基于VoxPopuli意大利语无标注数据预训练的语音识别模型,采用Facebook的Wav2Vec2架构
语音识别
其他
W
facebook
55
0
English Model
基于facebook/wav2vec2-large模型,使用Common Voice数据集进行英语微调的语音识别模型,支持16kHz采样率的语音输入。
语音识别
Transformers
E
tanmayplanet32
30
0
Wav2vec2 Large Xlsr 53 Esperanto
Apache-2.0
这是一个基于Facebook的wav2vec2-large-xlsr-53模型微调的世界语(Esperanto)语音识别模型,使用Common Voice数据集训练。
语音识别
其他
W
cpierse
8,681
6
Wav2vec2 Large Xlsr 53 French
Apache-2.0
这是一个基于wav2vec2架构的自动语音识别(ASR)模型,专门针对法语进行了微调,在Common Voice法语测试集上取得了12.82%的词错误率(WER)。
语音识别
Transformers
法语
W
Ilyes
31
4
Kabyle Xlsr
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m模型在卡拜尔语数据集上微调的自动语音识别(ASR)模型
语音识别
Transformers
其他
K
Akashpb13
39
2