LibriSpeech微调
Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在LibriSpeech数据集上微调的语音识别模型,在评估集上取得了0.3174的词错误率。
语音识别
Transformers
W
vishwasgautam
14
0
Hubert Base Librispeech Demo Colab
Apache-2.0
基于facebook/hubert-large-ls960-ft微调的语音识别模型,在LibriSpeech数据集上训练
语音识别
Transformers
H
vishwasgautam
101
0
F5 Ita Test
这是F5-TTS模型的意大利语微调版本,基于facebook/multilingual_librispeech数据集训练,专注于意大利语的文本转语音任务。
语音合成
其他
F
alien79
98
2
Speecht5 Finetuned Multilingual Librispeech De
MIT
基于Microsoft SpeechT5模型在德语LibriSpeech数据集上微调的文本转语音模型
语音合成
Transformers
德语
S
semaj83
14
0
Assignment1 Omar
Apache-2.0
Wav2Vec2是一个基于自监督学习的语音识别模型,在LibriSpeech 960小时语音数据上预训练和微调,支持英语语音转录。
语音识别
Transformers
英语
A
Classroom-workshop
28
0
Librispeech 100h Supervised Meta
Apache-2.0
基于Kuray107/librispeech-5h-supervised微调的语音识别模型,在100小时LibriSpeech数据集上训练
语音识别
Transformers
L
Kuray107
25
0
Data2vec Audio Large 960h
Apache-2.0
Data2Vec是一个通用自监督学习框架,适用于语音、视觉和语言任务。
语音识别
Transformers
英语
D
facebook
2,531
7
Sew D Mid 400k Librispeech Clean 100h Ft
Apache-2.0
该模型是基于asapp/sew-d-mid-400k在LIBRISPEECH_ASR - CLEAN数据集上微调得到的自动语音识别模型,在评估集上取得了1.0536的词错误率(WER)。
语音识别
Transformers
S
patrickvonplaten
15
1
Wavlm Libri Clean 100h Large
基于microsoft/wavlm-large在LIBRISPEECH_ASR - CLEAN数据集上微调的自动语音识别模型
语音识别
Transformers
W
patrickvonplaten
8,171
3
Unispeech Sat Base 100h Libri Ft
Apache-2.0
基于UniSpeech-SAT基础模型,在LibriSpeech语音数据上进行了100小时微调的自动语音识别模型
语音识别
Transformers
英语
U
microsoft
643
4
Wav2vec2 100m Mls German Ft
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-100m在多语言LibriSpeech德语数据集上微调的自动语音识别模型
语音识别
Transformers
W
patrickvonplaten
27
0
Wavlm Base Libri Clean 100
基于WavLM架构的自动语音识别模型,在LibriSpeech CLEAN数据集(100小时)上微调
语音识别
Transformers
W
anjulRajendraSharma
73
0
Librispeech 100h Supervised
Apache-2.0
该模型是基于facebook/wav2vec2-large-lv60在LibriSpeech 100小时数据集上进行微调的语音识别模型,取得了较低的词错误率。
语音识别
Transformers
L
Kuray107
14
0