韩语语音识别
Phi 4 Multimodal Instruct Ko Asr
基于microsoft/Phi-4-multimodal-instruct微调的韩语自动语音识别(ASR)和语音翻译(AST)模型,在zeroth-korean和fleurs数据集上表现优异。
文本生成音频
Transformers
韩语
P
junnei
354
3
Whisper Large V3 Turbo Korean
基于zeroth韩语数据集微调的Whisper Large V3 Turbo模型,专为韩语语音识别任务优化
语音识别
TensorBoard
韩语
W
ghost613
458
6
Wav2vec2 Large Xlrs Korean V5
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在zeroth_korean数据集上微调的韩语自动语音识别模型,词错误率为0.2433。
语音识别
Transformers
W
student-47
285
1
Whisper Small Ko
Apache-2.0
基于Whisper Small架构的韩语语音识别模型,针对多领域韩语数据集进行了微调训练
语音识别
Transformers
韩语
W
SungBeom
524
13
Stt Kr Conformer Ctc Medium
Apache-2.0
基于Conformer架构的韩语自动语音识别模型,针对流式处理优化,在客服语音等特定领域表现优异
语音识别
韩语
S
SungBeom
176
9
Hubert Base Korean
Apache-2.0
Hubert(Hidden-Unit BERT)是Facebook提出的一种语音表征学习模型,采用自监督学习方式直接从原始波形信号中学习语音特征。
语音识别
韩语
H
team-lucid
54
26
Whisper Large V2 Ko
Apache-2.0
基于OpenAI Whisper-large-v2微调的韩语自动语音识别(ASR)模型,在韩语数据集上表现出色
语音识别
Transformers
韩语
W
byoussef
94
22
Whisper Medium Ko Zeroth
Apache-2.0
基于OpenAI Whisper Medium模型在Zeroth韩语数据集上微调的语音识别模型,词错误率3.64%
语音识别
Transformers
韩语
W
seastar105
154
16
Wav2vec2 Ksponspeech
Apache-2.0
基于Ksponspeech数据集微调的韩语语音识别模型,在Wav2vec2-large-xlsr-53基础上优化
语音识别
Transformers
W
Taeham
111
4
Stt Kr Conformer Transducer Large
这是一个基于Conformer-Transducer架构的大规模韩语自动语音识别模型,在Ksponspeech数据集上训练,适用于韩语语音转录任务。
语音识别
其他
S
eesungkim
129
9
Wav2vec2 Large Xlsr Korean
Apache-2.0
基于Wav2Vec2 XLSR架构的韩语自动语音识别(ASR)模型,在Zeroth韩语数据集上表现出色
语音识别
Transformers
韩语
W
kresnik
1.7M
44
Wav2vec2 Xls R 300m Korean
Apache-2.0
基于XLS-R架构的韩语自动语音识别模型,在Zeroth Korean数据集上微调
语音识别
Transformers
韩语
W
w11wo
152
6
Wav2vec2 Xls R 300m Korean Lm
Apache-2.0
基于XLS-R架构的韩语自动语音识别模型,在Zeroth韩语数据集上微调并添加5-gram语言模型
语音识别
Transformers
韩语
W
w11wo
23
1
Wav2vec2 Xls R 1b Korean
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-1b在KRESNIK/ZEROTH_KOREAN - CLEAN数据集上微调的韩语自动语音识别模型
语音识别
Transformers
韩语
W
anantoj
20
2
Wav2vec2 Xlsr Korean Senior
Apache-2.0
基于wav2vec2-xlsr架构的韩语自动语音识别模型,专门针对韩国老年人语音进行优化
语音识别
Transformers
其他
W
hyyoka
26
0