Moonshine Tiny
MIT
月光模型是由Useful Sensors开发的自动语音识别(ASR)模型,专注于在资源受限设备上实现高效的英语语音转录。
语音识别
Transformers
英语
M
UsefulSensors
7,848
16
Asr Wav2vec2 Librispeech
Apache-2.0
这是一个基于LibriSpeech数据集训练的端到端自动语音识别系统,结合了wav2vec 2.0预训练模型和CTC技术,在英语语音识别任务上表现出色。
语音识别
英语
A
speechbrain
1,667
9
Iwslt Asr Wav2vec Large 4500h
基于Wav2Vec2架构的大规模英语自动语音识别模型,在4500小时多源语音数据上微调,支持带语言模型的解码
语音识别
Transformers
英语
I
nguyenvulebinh
27
2
Simpleoier Librispeech Asr Train Asr Conformer7 Wavlm Large Raw En Bpe5000 Sp
基于ESPnet框架训练的自动语音识别(ASR)模型,使用Conformer架构和WavLM大型预训练模型,在LibriSpeech数据集上训练。
语音识别
英语
S
espnet
66
1
Kamo Naoyuki Mini An4 Asr Train Raw Bpe Valid.acc.best
这是一个基于ESPnet2框架训练的自动语音识别(ASR)预训练模型,使用mini-an4数据集训练,支持英文语音识别。
语音识别
英语
K
espnet
425
1
S2t Medium Librispeech Asr
MIT
一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型,基于序列到序列转换器架构
语音识别
Transformers
英语
S
facebook
1,086
9
Sew Tiny 100k Ft Ls100h
Apache-2.0
SEW(压缩高效版Wav2vec)是由ASAPP Research开发的语音识别预训练模型,在性能和效率上优于wav2vec 2.0
语音识别
Transformers
支持多种语言
S
asapp
736
1