端到端ASR
Parakeet Tdt 0.6b V2 Onnx
NVIDIA Parakeet TDT 0.6B V2 是一个基于自动语音识别(ASR)任务的模型,适用于英语语音转文本任务。
语音识别
英语
P
istupakov
129
3
Nue Asr
Apache-2.0
Nue ASR是一种端到端的日语语音识别模型,集成了预训练的语音和语言模型,识别准确度高且速度快。
语音识别
Transformers
支持多种语言
N
rinna
722
24
Asr Wav2vec2 Commonvoice 14 Es
Apache-2.0
这是一个基于CommonVoice西班牙语数据集训练的端到端自动语音识别系统,使用wav2vec 2.0预训练模型结合CTC解码器。
语音识别
西班牙语
A
speechbrain
22
3
Asr Whisper Medium Commonvoice Ar
Apache-2.0
基于CommonVoice阿拉伯语数据集微调的Whisper medium语音识别模型,由SpeechBrain团队开发
语音识别
阿拉伯语
A
speechbrain
17
2
Asr Whisper Medium Commonvoice Fa
Apache-2.0
基于CommonVoice-14.0波斯语数据集微调的whisper medium模型,用于波斯语自动语音识别任务。
语音识别
其他
A
speechbrain
21
3
Faster Whisper Large V2 Japanese 5k Steps
MIT
基于Whisper Large V2模型的日语自动语音识别(ASR)模型,使用CTranslate2优化转换,支持高效推理。
语音识别
Transformers
日语
F
zh-plus
280
18
Asr Conformer Transformerlm Librispeech
Apache-2.0
基于SpeechBrain框架的自动语音识别模型,使用Conformer编码器和Transformer解码器,在LibriSpeech数据集上训练,支持英语语音识别。
语音识别
英语
A
speechbrain
984
7
Asr Whisper Large V2 Commonvoice Fa
Apache-2.0
这是一个基于whisper-large-v2架构的自动语音识别模型,专门针对波斯语在CommonVoice数据集上进行了微调。
语音识别
其他
A
speechbrain
103
15
Wav2vec2 Large Xlsr 53 Spanish Ep5 944h
适用于西班牙语自动语音识别的声学模型,基于facebook/wav2vec2-large-xlsr-53微调5个周期,使用约944小时西班牙语数据。
语音识别
Transformers
西班牙语
W
carlosdanielhernandezmena
111
3
Whisper Tiny.en
Apache-2.0
Whisper是一个预训练的自动语音识别(ASR)模型,在68万小时标注数据上训练,具有强大的泛化能力。
语音识别
英语
W
openai
145.30k
103
Whisper Small
Apache-2.0
Whisper是一个预训练的自动语音识别(ASR)和语音翻译模型,经过68万小时标注数据训练,具有强大的泛化能力。
语音识别
支持多种语言
W
openai
2.0M
381
Icefall Asr Gigaspeech Conformer Ctc
Icefall 是一个基于 k2 框架的自动语音识别(ASR)工具包,专注于高效和灵活的语音识别模型训练与推理。
语音识别
英语
I
speechcolab
0
0
Asr Wav2vec2 Dvoice Wolof
Apache-2.0
这是一个针对沃洛夫语的自动语音识别模型,基于wav2vec 2.0架构,在DVoice数据集上训练,支持沃洛夫语语音转录。
语音识别
其他
A
speechbrain
44
4
Asr Wav2vec2 Dvoice Amharic
Apache-2.0
这是一个针对阿姆哈拉语的自动语音识别模型,使用wav2vec 2.0架构和CTC/Attention机制训练
语音识别
其他
A
speechbrain
96
9
Wav2vec2 Large Xlsr Turkish Demo Colab
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型在common_voice土耳其语数据集上微调的语音识别模型
语音识别
Transformers
W
masoumehb
21
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在common_voice土耳其语数据集上微调的语音识别模型
语音识别
Transformers
W
abhiGOAT
19
0
Ascend With English
基于timit_asr数据集对ascend模型进行微调的英语语音识别模型
语音识别
Transformers
A
GleamEyeBeast
23
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,词错误率(WER)为0.3382
语音识别
Transformers
W
wasilkas
24
0
Wav2vec2 2 Bert Large No Adapter
基于LibriSpeech数据集训练的自动语音识别(ASR)模型,用于将英语语音转换为文本
语音识别
Transformers
W
speech-seq2seq
15
1
Wav2vec2 Large Xls R 300m Hindi Colab
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的印地语语音识别模型
语音识别
Transformers
W
nimrah
16
0
Wav2vec2 Large Xlsr Kyrgyz
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型在吉尔吉斯语通用语音数据集上微调的自动语音识别模型。
语音识别
其他
W
iarfmoose
22
2
Wav2vec2 Xls R 300m Bas CV8 V2
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在Common Voice 8数据集上微调的自动语音识别模型,支持巴斯克语(bas)。
语音识别
Transformers
其他
W
emre
18
0
Wav2vec2 Large Xlsr Mongolian
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53在蒙古语通用语音数据集上微调的自动语音识别模型
语音识别
其他
W
bayartsogt
16
1
Wav2vec2 Large Xlsr 53 Turkish
Apache-2.0
这是一个基于Facebook的wav2vec2-large-xlsr-53模型在土耳其语Common Voice数据集上微调的自动语音识别(ASR)模型。
语音识别
其他
W
ceyda
54
1
Asr Crdnn Commonvoice Fr
Apache-2.0
这是一个基于CommonVoice法语数据集训练的端到端自动语音识别系统,采用CRDNN架构结合CTC和注意力机制。
语音识别
法语
A
speechbrain
167
7
Wav2vec2 Base Vietnamese 250h
基于wav2vec 2.0架构的越南语自动语音识别模型,在13,000小时未标注音频和250小时标注数据上训练
语音识别
Transformers
其他
W
nguyenvulebinh
6,868
39
Asr Transformer Aishell
Apache-2.0
基于SpeechBrain框架预训练的AISHELL(普通话)端到端自动语音识别系统,采用Transformer编码器+联合解码器结构
语音识别
英语
A
speechbrain
76
11
Wav2vec2 Base Turkish Cv7
Apache-2.0
基于wav2vec2架构的土耳其语自动语音识别模型,在Common Voice 7.0土耳其语数据集上微调
语音识别
Transformers
其他
W
cahya
21
0
Wav2vec2 Large Xlsr 53 Lithuanian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型,使用Common Voice数据集对立陶宛语进行微调的自动语音识别模型。
语音识别
其他
W
anton-l
29
0
XLS R Marathi
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在马拉地语数据集上微调的自动语音识别模型
语音识别
Transformers
其他
X
StephennFernandes
34
0
Asr Wav2vec2 Commonvoice En
Apache-2.0
这是一个基于CommonVoice英语数据集训练的端到端自动语音识别系统,结合了wav2vec 2.0预训练模型和CTC解码器。
语音识别
英语
A
speechbrain
681
12
Wav2vec2 Large Xlsr Thai Demo
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在泰语通用语音数据集上微调的语音识别模型
语音识别
Transformers
其他
W
sakares
609
5
Wav2vec2 Base 100h
Apache-2.0
基于LibriSpeech 100小时数据训练的Wav2Vec2基础版语音识别模型
语音识别
Transformers
英语
W
vuiseng9
26
0
Wav2vec2 Large Xlsr Estonian
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型微调的爱沙尼亚语自动语音识别(ASR)模型,使用Common Voice数据集进行训练。
语音识别
其他
W
m3hrdadfi
26
0
Asr Wav2vec2 Commonvoice Fr
Apache-2.0
基于CommonVoice法语数据集训练的wav2vec 2.0语音识别模型,使用CTC/Attention架构,无需语言模型
语音识别
法语
A
speechbrain
250
10
Wav2vec2 Random
基于TIMIT_ASR数据集对wav2vec2-base-random模型进行微调的自动语音识别模型
语音识别
Transformers
W
patrickvonplaten
16
0