W

Wav2vec2 Large Xlsr Korean

由 kresnik 开发
基于Wav2Vec2 XLSR架构的韩语自动语音识别(ASR)模型,在Zeroth韩语数据集上表现出色
下载量 1.7M
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于韩语语音识别任务,能够将韩语语音转换为文本,具有高准确率和低错误率的特点

模型特点

高准确率
在Zeroth韩语测试集上达到4.74%的词错误率(WER)和1.78%的字错误率(CER)
大模型架构
基于Wav2Vec2 XLSR的大规模架构,适合韩语语音识别任务
预训练模型
提供预训练好的模型权重,可直接用于推理或微调

模型能力

韩语语音识别
音频转文本
自动语音转录

使用案例

语音转录
韩语会议记录
将韩语会议录音自动转换为文字记录
准确率高达95.26%(WER 4.74%)
语音助手
用于韩语语音助手应用的语音识别模块
教育
韩语学习应用
帮助韩语学习者检查发音准确性