低资源语音识别
Whisper Akan Finetuned
基于Whisper架构的自动语音识别模型,针对特定语言或方言进行了微调
语音识别
Transformers
W
dennis-9
68
1
Kinyawhisper
MIT
KinyaWhisper是基于OpenAI Whisper模型微调的卢旺达语自动语音识别(ASR)系统,专为低资源土著语言设计。
语音识别
Transformers
其他
K
benax-rw
149
3
Wav2vec2 Large Mms 1b Wolof
MIT
该模型是基于facebook/mms-1b-all在Isma/alffa_wolof数据集上微调的版本,专为沃洛夫语自动语音识别(ASR)任务设计。
语音识别
Safetensors
其他
W
bilalfaye
50
1
Xlsr 53 Bemba 5hrs
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53微调的语音识别模型,支持Bemba语
语音识别
Transformers
X
csikasote
25
0
Wav2vec2 Large 10min Lv60 Self
Apache-2.0
该模型是基于Wav2Vec2架构的大规模语音识别模型,在Libri-Light和Librispeech的10分钟数据上进行了预训练和微调,使用自训练目标进行训练,适用于16kHz采样率的语音音频。
语音识别
Transformers
英语
W
Splend1dchan
177
0
Wav2vec2 Large Xlsr Rm Sursilv
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型微调的自动语音识别模型,专门用于识别罗曼什语的苏塞尔瓦方言。
语音识别
W
gchhablani
27
0
Wav2vec2 Xls R 300m Bas CV8 V2
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在Common Voice 8数据集上微调的自动语音识别模型,支持巴斯克语(bas)。
语音识别
Transformers
其他
W
emre
18
0
Wav2vec Test
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53微调的埃及阿拉伯语自动语音识别模型,使用arabicspeech.org MGB-3数据集训练。
语音识别
Transformers
阿拉伯语
W
othrif
27
0
Unispeech 1350 En 90 It Ft 1h
UniSpeech是一个统一的语音表征学习模型,结合了监督式音素CTC学习和自监督学习,特别针对意大利语进行了微调。
语音识别
Transformers
其他
U
microsoft
19
0
Xls R Ta
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在泰米尔语数据集上微调的自动语音识别模型
语音识别
Transformers
其他
X
jejomi
22
0
Wav2vec2 Large Xlsr 53 Rm Vallader
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的罗曼什语瓦拉迪尔方言语音识别模型,词错误率32.89%
语音识别
W
anuragshas
58
0
Asr Hubert Cluster Bart Base
Apache-2.0
基于Hubert和BART架构的自动语音识别模型,通过聚类特征转换实现语音到文本的转换
语音识别
Transformers
支持多种语言
A
voidful
13
0
Wav2vec2 Large Xlsr Egyptian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的埃及阿拉伯语自动语音识别模型,支持16kHz采样率的语音输入。
语音识别
Transformers
其他
W
othrif
19
0
Wav2vec2 Xls R 1b Hi Cv8
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-1b模型在Common Voice 8.0印地语数据集上微调的自动语音识别模型,支持印地语语音转文本任务。
语音识别
Transformers
其他
W
anuragshas
16
0
Wav2vec2 Base 100h
Apache-2.0
Wav2Vec2基础版是在16kHz采样的Librispeech语音音频上进行了100小时预训练和微调的自动语音识别模型。
语音识别
Transformers
英语
W
facebook
4,380
6
Wav2vec2 Xls R 60 Urdu
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在Common Voice乌尔都语数据集上微调的自动语音识别模型
语音识别
Transformers
其他
W
Maniac
16
1
Xlsr Large 53 Ur
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在Common Voice 8.0乌尔都语数据集上微调的自动语音识别模型
语音识别
Transformers
其他
X
HarrisDePerceptron
14
0
Xls R 1b Ur
Apache-2.0
基于Facebook的wav2vec2-xls-r-1b模型微调的乌尔都语自动语音识别(ASR)模型,在Common Voice 8.0乌尔都语数据集上训练
语音识别
Transformers
其他
X
HarrisDePerceptron
21
0
Xls R 300m Ur Cv7
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - UR数据集上微调的乌尔都语自动语音识别(ASR)模型
语音识别
Transformers
其他
X
HarrisDePerceptron
19
0
Xls R 300m Ur
Apache-2.0
这是一个基于XLS-R架构在Common Voice 8.0乌尔都语数据集上微调的自动语音识别模型,词错误率(WER)为47.38。
语音识别
Transformers
其他
X
HarrisDePerceptron
19
0