Whisper Small Cv11 French
Apache-2.0
基于openai/whisper-small微调的法语自动语音识别模型,训练数据为Common Voice 11.0法语数据集,支持大小写和标点符号预测。
语音识别
Transformers
法语
W
bofenghuang
266
4
Whisper Small Cv11 German
Apache-2.0
基于openai/whisper-small在Common Voice 11.0德语数据集上微调的语音识别模型,支持德语语音转文字并预测大小写和标点符号。
语音识别
Transformers
德语
W
bofenghuang
67
7
Sepformer Wham16k Enhancement
Apache-2.0
这是一个使用SepFormer架构的语音增强模型,专门用于去除音频中的噪声和混响,在WHAM!数据集上以16kHz采样频率训练。
音频增强
英语
S
speechbrain
5,140
28
Viwav2vec2 Base 1.5k
该模型通过1.5千小时越南语语音数据预训练得到,适用于越南语语音识别任务,需微调后使用。
语音识别
Transformers
其他
V
dragonSwing
38
0
Hubert Large Ls960 Ft
Apache-2.0
HuBERT-Large是基于LibriSpeech 960小时语音数据微调的自监督语音表示学习模型,用于自动语音识别任务。
语音识别
Transformers
英语
H
facebook
776.27k
66
Wav2vec2 Large Pitch Recognition
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在日语口音数据集上微调的语音识别模型
语音识别
Transformers
日语
W
vumichien
15
2
Wav2vec2 Large Xlsr 53 French
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在Common Voice法语数据集上微调的自动语音识别模型,测试WER为34.86%。
语音识别
法语
W
MehdiHosseiniMoghadam
21
0