W

Wav2vec2 Large Xls R 300m Russian Colab Beam Search Test

由 jfealko 开发
该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的俄语语音识别模型,在评估集上取得了0.468的词错误率。
下载量 18
发布时间 : 4/7/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对俄语优化的语音识别模型,基于wav2vec2-xls-r-300m架构微调,适用于俄语语音转文本任务。

模型特点

俄语优化
专门针对俄语语音数据进行微调,提高了俄语识别的准确性
低词错误率
在评估集上取得了0.468的词错误率,表现良好
基于大模型微调
基于facebook/wav2vec2-xls-r-300m大模型微调,继承了其强大的语音特征提取能力

模型能力

俄语语音识别
语音转文本
自动语音识别

使用案例

语音转录
俄语会议记录
将俄语会议录音自动转录为文本
准确率约53.2%(词错误率0.468)
俄语语音助手
用于俄语语音助手的语音识别模块
教育
俄语学习辅助
帮助俄语学习者检查发音准确性