语音转文本
Whisper Finetuned Amharic
Apache-2.0
基于openai/whisper-small微调的阿姆哈拉语语音识别模型,在评估集上词错误率为2.0538%
语音识别
Transformers
W
seyyaw
57
1
Wav2vec2 Large Xls R 300m Ru
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_17_0数据集上微调的俄语自动语音识别(ASR)模型,词错误率(WER)为0.195。
语音识别
Transformers
W
NLPVladimir
56
1
Whisper Hindi2Hinglish Swift
Apache-2.0
基于Whisper架构优化的印地语-印地英语混合语音识别模型,专为印度口音和噪声环境优化
语音识别
Transformers
支持多种语言
W
Oriserve
496
6
Moonshine Base ONNX
MIT
基于Moonshine基础模型的ONNX格式自动语音识别模型,支持高效推理
语音识别
Transformers
M
onnx-community
1,171
29
Whisper Large V3 Turbo
基于ONNX格式优化的Whisper大型语音识别模型,专为网页端部署设计
语音识别
Transformers
W
onnx-community
2,988
54
W2V2 BERT Withlm Malayalam
MIT
基于facebook/w2v-bert-2.0微调的马拉雅拉姆语自动语音识别模型,在多个马拉雅拉姆语数据集上训练,并使用了KENLM库训练的三元语言模型。
语音识别
Transformers
其他
W
vrclc
65
3
Whisper Base
Whisper是一个自动语音识别(ASR)系统,由OpenAI训练,支持多语言语音转录。
语音识别
Transformers
W
onnx-community
5,704
19
Faster Distil Whisper Large V3
MIT
Whisper Large v3的蒸馏版本,用于高效自动语音识别(ASR)
语音识别
英语
F
Systran
18.55k
49
Distil Whisper Large V3
Apache-2.0
该模型是从GGML格式的distil-whisper/distil-large-v3-ggml转换至Ratchet自定义格式的版本,主要用于语音识别任务。
语音识别
D
FL33TW00D-HF
164
4
Whisper Tiny
Apache-2.0
这是将openai/whisper-tiny的GGML格式转换为Ratchet自定义格式的版本
语音识别
W
FL33TW00D-HF
17.21k
5
Language Detector
Apache-2.0
基于openai/whisper-small微调的语言检测模型,在评估集上准确率达96.47%
语音识别
Transformers
L
fitlemon
18
1
Audio Transcribe
这是一个基于Transformers的自动语音识别(ASR)模型,用于将音频文件转录为文本。
语音识别
A
washeed
257
4
Audiosangraha Audio To Text
Apache-2.0
基于openai/whisper-small微调的语音转文本模型,支持音频翻译和文本生成任务。
语音识别
Transformers
A
AqeelShafy7
224
4
Whisper Large V3 Ft Cv16 Mn
Apache-2.0
基于OpenAI Whisper Large V3模型在Common Voice 16.0数据集上微调的语音识别模型
语音识别
Transformers
W
sanchit-gandhi
34
1
Speecht5 Tts Marathi
这是一个用于马拉地语语音处理的模型,可能涉及语音识别或语音合成任务。
语音识别
Transformers
S
Patil
26
0
Whisper Large V2 Spanish
Apache-2.0
基于OpenAI Whisper-large-v2模型在Common Voice 13.0西班牙语数据集上微调的语音识别模型
语音识别
Transformers
W
Sandiago21
38
3
Whisper Medium
Whisper Medium 是 OpenAI 开发的中等规模语音识别模型,支持多种语言的自动语音识别(ASR)任务。
语音识别
Transformers
W
Xenova
871
4
Whisper Small
Whisper Small 是 OpenAI 开发的一个小型自动语音识别(ASR)模型,能够将语音转换为文本。
语音识别
Transformers
W
Xenova
1,716
9
Whisper Base
Whisper是一个自动语音识别(ASR)系统,由OpenAI训练,支持多种语言的语音转文本任务。
语音识别
Transformers
W
Xenova
6,204
7
Whisper Tiny
Whisper Tiny 是 OpenAI 开源的轻量级语音识别模型,适用于网页端部署。
语音识别
Transformers
W
Xenova
21.70k
8
Speecht5 Asr
MIT
基于LibriSpeech数据集微调的SpeechT5自动语音识别模型,支持将语音转换为文本。
语音识别
Transformers
S
microsoft
12.30k
41
Whisper Base
Apache-2.0
Whisper是一个预训练的自动语音识别(ASR)和语音翻译模型,经过68万小时标注数据训练,具有强大的泛化能力。
语音识别
支持多种语言
W
openai
491.35k
216
Wav2vec2 Large 960h Lv60 Self 4 Gram Fine Tune Real 29 Jun
Apache-2.0
该模型是基于facebook/wav2vec2-large-960h-lv60-self在uob_singlish数据集上微调的语音识别模型,支持新加坡英语识别。
语音识别
Transformers
W
RuiqianLi
105
0
Wav2vec2 Large Xls R 300m Bn Colab
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_9_0数据集上微调的语音识别模型,支持孟加拉语。
语音识别
Transformers
W
rhr99
18
0
Wav2vec2 Xls R 300m Mrbrown Finetune1
Apache-2.0
基于facebook/wav2vec2-xls-r-300m预训练模型,使用uob_singlish数据集进行微调的语音识别模型
语音识别
Transformers
W
RuiqianLi
18
0
Wav2vec2 Large Multilang Cv Ru
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice数据集上微调的版本,主要用于俄语语音识别任务。
语音识别
Transformers
W
cutten
16
0
Wav2vec2 Large Xls R 300m Ta Colab
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的版本,主要用于泰米尔语的语音识别任务。
语音识别
Transformers
W
AAkhilesh
24
0
84rry Xlsr 53 Arabic
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在通用语音数据集上微调的阿拉伯语语音识别模型
语音识别
Transformers
8
84rry
24
0
Wav2vec2 Large Xls R 300m Turkish Colab Common Voice 8 6
Apache-2.0
这是一个基于wav2vec2架构的土耳其语语音识别模型,在common_voice数据集上微调得到
语音识别
Transformers
W
husnu
21
0
Wav2vec2 Large Xls R 300m Turkish Colab Common Voice 8 4
Apache-2.0
该模型是基于Facebook的wav2vec2-xls-r-300m模型,在common_voice土耳其语数据集上微调的语音识别模型。
语音识别
Transformers
W
husnu
19
0
Dansk Wav2vec21
Apache-2.0
该模型是基于Siyam/SKYLy在common_voice数据集上微调得到的丹麦语语音识别模型
语音识别
Transformers
D
Siyam
32
0
Wav2vec2 Vorarlbergerisch
Apache-2.0
基于facebook/wav2vec2-base-960h微调的德语方言语音识别模型,支持奥地利福拉尔贝格地区方言识别
语音识别
Transformers
W
bkh6722
21
0
Wav2vec2 Base MIR ST500 ASR 109
Apache-2.0
基于facebook/wav2vec2-base在MIR_ST500数据集上微调的自动语音识别模型
语音识别
Transformers
W
gary109
15
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
这是一个基于Facebook的wav2vec2-xls-r-300m模型在通用语音数据集上微调的土耳其语语音识别模型。
语音识别
Transformers
W
jekdoieao
30
0
2nd Wav2vec2 L Xls R 300m Turkish Test
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice土耳其语数据集上微调的语音识别模型,在评估集上取得了0.4444的词错误率。
语音识别
Transformers
2
Khalsuu
29
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice土耳其语数据集上微调的语音识别模型,在评估集上取得了30.95%的词错误率。
语音识别
Transformers
W
dennisowusuk
15
0
Wav2vec2 Common Voice Accents Scotland
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的版本,专注于苏格兰口音的语音识别。
语音识别
Transformers
W
willcai
19
0
Wav2vec2 Common Voice Accents
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的语音识别模型,支持多种口音识别
语音识别
Transformers
W
willcai
24
0
Wav2vec2 Large Xlsr 129 Turkish Colab
基于facebook/wav2vec2-large-xlsr-129模型在通用语音数据集上微调的土耳其语语音识别模型
语音识别
Transformers
W
patrickvonplaten
16
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在common_voice土耳其语数据集上微调的语音识别模型
语音识别
Transformers
W
patrickvonplaten
18
1