W

Wav2vec2 Xls R 300m Korean

由 w11wo 开发
基于XLS-R架构的韩语自动语音识别模型,在Zeroth Korean数据集上微调
下载量 152
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于XLS-R架构的自动语音识别模型,专门针对韩语进行优化,适用于语音转文本任务。

模型特点

韩语优化
专门针对韩语语音识别进行微调,在韩语数据集上表现良好。
XLS-R架构
基于先进的XLS-R架构,具有强大的语音特征提取能力。
多数据集验证
在多个韩语数据集上进行评估,包括Zeroth Korean和鲁棒语音赛事数据。

模型能力

韩语语音识别
语音转文本
自动语音识别

使用案例

语音转写
韩语语音转文本
将韩语语音内容转换为文本
在Zeroth Korean数据集上WER为29.54%,CER为9.53%
语音识别挑战
鲁棒语音赛事
参与HuggingFace组织的鲁棒语音识别挑战
在开发数据上WER为76.26%,CER为38.67%