W

Wav2vec2 Xls R 1b Russian

由 jonatasgrosman 开发
基于XLS-R 1B架构微调的俄语语音识别模型,在Common Voice 8.0等数据集上训练
下载量 765
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对俄语优化的自动语音识别(ASR)模型,基于Facebook的XLS-R 1B架构微调而成,支持16kHz采样率的语音输入。

模型特点

高性能俄语识别
在Common Voice 8.0测试集上达到9.82%的WER和2.3%的CER
语言模型增强
结合语言模型后,WER可降至7.08%,CER降至1.87%
多数据集训练
使用Common Voice 8.0、Golos和Multilingual TEDx等多个数据集进行训练
鲁棒性表现
在鲁棒语音事件测试数据上取得14.23% WER的成绩

模型能力

俄语语音识别
语音转文本
支持16kHz采样率音频处理

使用案例

语音转录
俄语语音转文字
将俄语语音内容转换为文本
高准确率的转录结果
语音助手
俄语语音指令识别
用于俄语语音助手或控制系统的语音指令识别
快速准确的指令理解