高精度语音转文本
Parakeet Tdt 0.6b V2
基于 NVIDIA Parakeet TDT 0.6B v2 转换的 MLX 格式自动语音识别模型,支持高效语音转文本任务。
语音识别
P
mlx-community
24.49k
13
Aidman Wav2vec2 Large Xls R 300m Irish Colab
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的语音识别模型,支持爱尔兰语。
语音识别
Transformers
A
AIDman
110
0
Whisper Large V3 Turbo Cantonese Yue English
MIT
基于Whisper架构优化的粤语与英语混合语音识别模型,支持高精度双语转录
语音识别
Transformers
W
JackyHoCL
73
4
Whisper Large V2 Spanish
Apache-2.0
基于openai/whisper-large-v2微调的西班牙语语音识别模型,在Common Voice 11.0西班牙语测试集上WER为8.55%
语音识别
Transformers
W
clu-ling
85
2
Exp W2v2t Sv Se Wavlm S42
Apache-2.0
基于microsoft/wavlm-large微调的瑞典语自动语音识别模型,适用于16kHz采样率的语音输入。
语音识别
Transformers
E
jonatasgrosman
20
0
Wav2vec2 Large Xls R 300m Slovenian
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice斯洛文尼亚语数据集上微调的语音识别模型,词错误率为0.3271。
语音识别
Transformers
W
bekirbakar
278
0
Wav2vec2 Large Xls R 300m Kinyarwanda
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的卢旺达语语音识别模型
语音识别
Transformers
W
peter2000
13
0
Victor Hg Ptbr 2.0
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的葡萄牙语语音识别模型
语音识别
Transformers
V
Vkt
30
0
Wav2vec2 Large Xls R 300m Chinese Taiwan Colab
Apache-2.0
基于wav2vec2架构的大规模语音识别模型,针对中文(台湾)语音进行优化,适用于语音转文本任务。
语音识别
Transformers
W
RuiqianLi
17
1
Wav2vec2 Xlsr Nepali
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在尼泊尔语数据集上微调的语音识别模型。
语音识别
W
shishirAI
22
2
Wav2vec2 2 Rnd
基于 LibriSpeech ASR 数据集训练的自动语音识别模型,用于将英语语音转换为文本。
语音识别
Transformers
W
sanchit-gandhi
16
0
Wav2vec2 Large Xlsr Slovene
Apache-2.0
这是一个基于Facebook的wav2vec2-large-xlsr-53模型进行微调的斯洛文尼亚语语音识别模型,使用Common Voice数据集训练。
语音识别
其他
W
mrshu
23
2
Wav2vec2 Large Xlsr 53 Latvian
Apache-2.0
这是一个基于Facebook的Wav2Vec2-Large-XLSR-53模型在拉脱维亚语Common Voice数据集上微调的自动语音识别(ASR)模型。
语音识别
其他
W
anton-l
137
1
Wav2vec2 Base 10k Voxpopuli Ft Ro
基于Facebook Wav2Vec2架构的语音识别模型,针对罗马尼亚语进行微调,适用于自动语音识别任务。
语音识别
Transformers
其他
W
facebook
36
0
Wav2vec2 Base 10k Voxpopuli Ft Es
基于Facebook Wav2Vec2基础模型,在VoxPopuli语料库的10K未标注子集上预训练,并在西班牙语转录数据上微调的语音识别模型。
语音识别
Transformers
西班牙语
W
facebook
34
1
Iloko Model
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在未知数据集上微调的自动语音识别(ASR)模型,支持伊洛卡诺语(Iloko)语音识别。
语音识别
Transformers
I
denden
28
0
W2v Timit Ft 4001
基于Wav2Vec 2.0架构的语音识别模型,在TIMIT数据集上微调,适用于英语语音转文本任务
语音识别
Transformers
W
devin132
22
0
Wav2vec2 Large Xlsr Latvian Cv
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型,在拉脱维亚语Common Voice数据集上微调的语音识别模型
语音识别
其他
W
jimregan
5,323
1
Wav2vec2 Large Xlsr Hindi Commonvoice
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice数据集上微调的版本,主要用于印地语语音识别任务。
语音识别
Transformers
W
nikhil6041
17
0
Wav2vec2 Large Xlsr 53 Irish
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型,使用Common Voice数据集对爱尔兰语进行了微调的语音识别模型。
语音识别
W
cpierse
22
0
Wav2vec2 Base 10k Voxpopuli Ft En
基于VoxPopuli语料库10K未标记子集预训练并在英语转录数据上微调的Wav2Vec2基础模型,适用于英语语音识别任务。
语音识别
Transformers
英语
W
facebook
40
1
Wav2vec2 Base 10k Voxpopuli Ft Sl
基于Facebook Wav2Vec2基础模型,在VoxPopuli语料库的10K未标注子集上预训练,并在斯洛文尼亚语转录数据上微调的自动语音识别模型。
语音识别
Transformers
其他
W
facebook
26
0
Wav2vec2 Large Xlsr Or
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型在Odia语言上微调的自动语音识别(ASR)模型,使用Common Voice数据集训练。
语音识别
其他
W
gchhablani
22
1
Wav2vec2 Large Xlsr Eo
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型,使用Common Voice数据集对世界语进行微调的语音识别模型。
语音识别
其他
W
gchhablani
23
1
Wav2vec2 Base 10k Voxpopuli Ft De
基于Facebook Wav2Vec2基础模型,在VoxPopuli语料库10K无标注子集上预训练,并在德语转录数据上微调的语音识别模型
语音识别
Transformers
德语
W
facebook
46
1
W2v Xlsr Dutch Lm
这是一个基于wav2vec2架构的荷兰语语音识别模型,由Facebook开发,专门针对荷兰语进行了优化。
语音识别
Transformers
W
Iskaj
23
0
W2v Xlsr Dutch Lm Added
Facebook 发布的 wav2vec2 系列模型之一,专门针对荷兰语优化的自动语音识别(ASR)模型。
语音识别
W
Iskaj
24
0