多语言语音转写
Granite Speech 3.3 8b
Apache-2.0
专为自动语音识别(ASR)和自动语音翻译(AST)设计的紧凑高效语音语言模型,采用双阶段设计处理音频和文本
文本生成音频
Transformers
英语
G
ibm-granite
5,532
35
Whisper Fleurs Small Te In
Apache-2.0
该模型是基于OpenAI的Whisper Small在FLEURS数据集上微调的版本,专注于语音识别任务,支持泰卢固语(te)。
语音识别
Transformers
其他
W
jonahdvt
14
1
Lite Whisper Large V3 Acc
Apache-2.0
Lite-Whisper 是 OpenAI Whisper 的压缩版本,采用 LiteASR 技术,在保持高准确率的同时减小模型大小。
语音识别
Transformers
L
efficient-speech
57
3
Whisper Base Pl
Apache-2.0
基于OpenAI Whisper-base模型在波兰语Common Voice 17.0数据集上微调的语音识别模型
语音识别
Transformers
其他
W
marcsixtysix
27
1
Whisper Large V3 Telugu Romanized
Apache-2.0
基于openai/whisper-large-v3微调的罗马化泰卢固语语音识别模型
语音识别
Transformers
其他
W
jayasuryajsk
18
1
English Filipino Wav2vec2 L Xls R Test 08
Apache-2.0
这是一个基于wav2vec2-large-xlsr-53-english模型在菲律宾语音数据集上微调的语音识别模型
语音识别
Transformers
E
Khalsuu
25
0
English Filipino Wav2vec2 L Xls R Test 05
Apache-2.0
这是一个基于wav2vec2-large-xlsr-53-english模型在菲律宾语音数据集上微调的语音识别模型,支持英语和菲律宾语的语音转文本任务。
语音识别
Transformers
E
Khalsuu
67
1
English Filipino Wav2vec2 L Xls R Test 02
Apache-2.0
这是一个基于wav2vec2-large-xlsr-53-english模型在菲律宾语音数据集上微调的语音识别模型,支持英语和菲律宾语的语音转文本任务。
语音识别
Transformers
E
Khalsuu
21
0
Pyctcdecode Asr
结合pyctcdecode库与Hugging Face模型的自动语音识别(ASR)解决方案,提供高效的解码能力
语音识别
P
osanseviero
16
1