W

Wav2vec2 Large Xls R 300m Slovenian

由 bekirbakar 开发
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice斯洛文尼亚语数据集上微调的语音识别模型,词错误率为0.3271。
下载量 278
发布时间 : 6/6/2022
模型介绍
内容详情
替代品

模型简介

一个针对斯洛文尼亚语优化的语音识别模型,基于wav2vec2-xls-r-300m架构微调,适用于语音转文本任务。

模型特点

高性能语音识别
在common_voice斯洛文尼亚语数据集上取得了0.3271的词错误率
基于大模型微调
基于3亿参数的wav2vec2-xls-r-300m模型进行微调,继承了原模型的强大特征提取能力
优化训练流程
采用线性学习率调度和500步预热,训练20轮达到最佳效果

模型能力

斯洛文尼亚语语音识别
音频转文本
语音内容分析

使用案例

语音转录
会议记录自动化
将斯洛文尼亚语会议录音自动转为文字记录
准确率约67.29%
语音助手
为斯洛文尼亚语用户提供语音交互支持
教育技术
语言学习应用
帮助学习者练习斯洛文尼亚语发音和听力