端到端语音识别
Fsmn Vad
其他
FunASR是一个致力于连接语音识别学术研究与工业应用的基础工具包,支持语音识别、语音活动检测、标点恢复等多种功能。
语音识别
F
funasr
107
17
Assignment1 Francesco
MIT
基于语音到文本转换器(S2T)训练的自动语音识别(ASR)模型,专为英语语音识别设计
语音识别
Transformers
英语
A
Classroom-workshop
22
0
Assignment1 Maria
MIT
s2t-small-librispeech-asr 是一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型,基于序列到序列的转换器架构。
语音识别
Transformers
英语
A
Classroom-workshop
23
0
Assignment1 Joane
MIT
一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型
语音识别
Transformers
英语
A
Classroom-workshop
22
0
Assignment1 Jack
MIT
一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型,基于序列到序列转换器架构
语音识别
Transformers
英语
A
Classroom-workshop
24
0
Assignment1 Jane
MIT
s2t-small-librispeech-asr 是一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型,基于序列到序列转换器架构。
语音识别
Transformers
英语
A
Classroom-workshop
29
0
Asr Wav2vec2 Commonvoice Rw
Apache-2.0
这是一个用于卢旺达语自动语音识别的端到端模型,基于wav2vec 2.0预训练模型结合CTC和注意力机制,在CommonVoice数据集上微调。
语音识别
其他
A
speechbrain
28
1
Wav2vec2 Base Turkish Cv8
这是一个基于Common Voice 8.0土耳其语数据集微调的自动语音识别(ASR)模型,能够将土耳其语语音转换为文本。
语音识别
Transformers
其他
W
cahya
16
1
S2t Small Librispeech Asr
MIT
一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型,基于序列到序列转换器架构
语音识别
Transformers
英语
S
facebook
10.92k
27
Wav2vec2 Marathi Stt
这是一个基于Wav2Vec2架构的马拉地语(Marathi)语音识别模型,可直接将语音转换为文本。
语音识别
Transformers
W
addy88
30
0
S2t Large Librispeech Asr
MIT
一个用于自动语音识别(ASR)的端到端序列到序列转换器模型,基于LibriSpeech数据集训练
语音识别
Transformers
英语
S
facebook
422
10
Kamo Naoyuki Mini An4 Asr Train Raw Bpe Valid.acc.best
这是一个基于ESPnet2框架训练的自动语音识别(ASR)预训练模型,使用mini-an4数据集训练,支持英文语音识别。
语音识别
英语
K
espnet
425
1
S2t Medium Librispeech Asr
MIT
一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型,基于序列到序列转换器架构
语音识别
Transformers
英语
S
facebook
1,086
9