S

Stt Kr Conformer Ctc Medium

由 SungBeom 开发
基于Conformer架构的韩语自动语音识别模型,针对流式处理优化,在客服语音等特定领域表现优异
下载量 176
发布时间 : 6/4/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于Conformer-CTC架构的韩语自动语音识别模型,针对AI Hub数据集进行了微调。相比基于注意力机制的模型,它在流式处理时性能下降较小且速度更快,特别适合实时语音识别应用。

模型特点

流式处理优化
相比Whisper等基于注意力机制的模型,在流式处理时性能下降较小(约20%),且处理速度更快
高效推理
在V100 GPU上实时因子(RTF)为0.05,CPU(7核)上为0.35,适合实时应用
领域适应性强
在客服语音等特定领域,结合KenLM后词错误率可从13.45显著降至5.27

模型能力

韩语语音识别
实时流式语音处理
特定领域语音识别优化

使用案例

客服领域
客服语音转录
用于客服电话的实时语音转录
结合KenLM后词错误率从13.45降至5.27
车载系统
车内语音指令识别
用于识别车内对话和语音指令