W

Wav2vec2 Large Xls R 300m Ru

由 NLPVladimir 开发
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_17_0数据集上微调的俄语自动语音识别(ASR)模型,词错误率(WER)为0.195。
下载量 56
发布时间 : 1/30/2025
模型介绍
内容详情
替代品

模型简介

这是一个用于俄语自动语音识别的模型,基于wav2vec2架构,在Common Voice数据集上微调。

模型特点

低词错误率
在Common Voice俄语测试集上达到0.195的词错误率(WER)
基于大规模预训练模型
基于facebook/wav2vec2-xls-r-300m预训练模型微调
高效训练
使用混合精度训练和梯度累积等技术优化训练效率

模型能力

俄语语音识别
语音转文本
音频内容分析

使用案例

语音转录
俄语语音转录
将俄语语音转换为文本
词错误率0.195
语音助手
俄语语音指令识别
用于俄语语音助手的基础识别能力