wav2vec2-large-xlrs-korean-v5开源韩语语音识别模型，低错误率精准识别

Wav2vec2 Large Xlrs Korean V5

由 student-47 开发

该模型是基于facebook/wav2vec2-xls-r-300m在zeroth_korean数据集上微调的韩语自动语音识别模型，词错误率为0.2433。

下载量 285

发布时间 : 5/25/2024

模型简介

这是一个针对韩语优化的自动语音识别模型，基于Facebook的wav2vec2-xls-r-300m架构微调而成，适用于韩语语音转文本任务。

韩语优化

专门针对韩语语音识别任务进行微调，在zeroth_korean数据集上表现良好。

基于wav2vec2-xls-r架构

采用Facebook强大的wav2vec2-xls-r-300m基础模型，具备优秀的语音特征提取能力。

低词错误率

在评估集上取得了0.2433的词错误率，表现优异。

韩语语音识别

语音转文本

自动语音转录

语音转录

韩语会议记录

自动将韩语会议录音转换为文字记录

准确率约75.67%

韩语客服录音转写

将客户服务电话录音自动转换为文本

语音助手

韩语语音指令识别

用于韩语智能设备的语音指令识别系统

训练损失	轮数	步数	验证损失	字错率（Wer）
5.1453	1.4368	500	3.1530	1.0
2.4287	2.8736	1000	0.6084	0.8317
0.5556	4.3103	1500	0.3414	0.6165
0.3929	5.7471	2000	0.2729	0.5386
0.3211	7.1839	2500	0.2294	0.4794
0.281	8.6207	3000	0.2052	0.4298
0.2483	10.0575	3500	0.1911	0.4061
0.2243	11.4943	4000	0.1685	0.3873
0.2023	12.9310	4500	0.1627	0.3524
0.188	14.3678	5000	0.1572	0.3272
0.1784	15.8046	5500	0.1495	0.3131
0.1677	17.2414	6000	0.1424	0.2881
0.1533	18.6782	6500	0.1418	0.2709
0.1501	20.1149	7000	0.1387	0.2822
0.1402	21.5517	7500	0.1401	0.2697
0.1353	22.9885	8000	0.1367	0.2643
0.133	24.4253	8500	0.1337	0.2578
0.1254	25.8621	9000	0.1355	0.2560
0.1262	27.2989	9500	0.1339	0.2474
0.121	28.7356	10000	0.1300	0.2433