端到端语音转文本
Faster Whisper Small.en
MIT
基于OpenAI Whisper small.en模型的CTranslate2转换版本,用于高效语音识别
语音识别
英语
F
Systran
129.26k
4
Wav2vec2 Xls R 300m Mixed
基于Facebook的wav2vec2-xls-r-300m模型在混合语言数据集上微调的语音识别模型,支持马来语、新加坡式英语和普通话。
语音识别
Transformers
W
mesolitica
10.07k
4
My Final Wav2vec2 Urdu Asr Project
这是一个基于wav2vec2架构的乌尔都语自动语音识别(ASR)模型,从头开始训练。
语音识别
Transformers
M
Raffay
24
0
S2t Wav2vec2 Large En Tr
MIT
一个基于Transformer的端到端语音翻译模型,用于英语到土耳其语的语音转文本任务
语音识别
Transformers
支持多种语言
S
facebook
55
3
Wav2vec2 Xls R 300m Ab CV8
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的版本,用于阿布哈兹语的自动语音识别任务。
语音识别
Transformers
其他
W
emre
20
0
S2t Wav2vec2 Large En Ar
MIT
基于Transformer的端到端语音翻译模型,支持英语到阿拉伯语的语音转文本翻译
语音识别
Transformers
支持多种语言
S
facebook
62
7
Wav2vec2 Large Xlsr Georgian
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型在格鲁吉亚语上进行微调的自动语音识别(ASR)模型,使用Common Voice数据集训练。
语音识别
其他
W
m3hrdadfi
66
5
Wav2vec2 Large Xlsr Hindi Demo Colab
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice数据集上微调的版本,用于印地语语音识别任务。
语音识别
Transformers
W
nikhil6041
19
0
S2t Small Covost2 En Ca St
MIT
这是一个基于Transformer的端到端语音翻译模型,专门用于将英语语音翻译成加泰罗尼亚语文本。
语音识别
Transformers
支持多种语言
S
facebook
15
0
Hindi Wav2vec2 Stt
一个基于Wav2Vec2架构的印地语语音识别模型,可直接将音频转录为文本。
语音识别
Transformers
H
addy88
207
1
Wav2vec2 Base 100h
Apache-2.0
Wav2Vec2基础版是在16kHz采样的Librispeech语音音频上进行了100小时预训练和微调的自动语音识别模型。
语音识别
Transformers
英语
W
facebook
4,380
6
Wav2vec2 Large Xlsr 53 French
Apache-2.0
Facebook开发的基于Wav2Vec 2.0架构的大规模法语语音识别模型,支持自动语音转文本任务
语音识别
法语
W
facebook
2,264
13
Wav2vec2 Large Xlsr 53 Lithuanian
Apache-2.0
基于Facebook的XLSR-53大模型微调的立陶宛语语音识别模型,在Common Voice数据集上训练,测试WER为56.55%。
语音识别
其他
W
DeividasM
4,105
1
Asr Voxrex Bart Base
这是一个基于序列到序列架构的自动语音识别模型,能够将语音转换为文本。
语音识别
Transformers
A
KBLab
28
0