W

Wav2vec2 Large Ru Golos With Lm

由 bond005 开发
这是一个基于facebook/wav2vec2-large-xlsr-53微调的俄语语音识别模型,使用Sberdevices Golos数据集训练,并集成了2-gram语言模型以提高识别准确率。
下载量 434
发布时间 : 9/26/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于俄语语音识别任务,支持16kHz采样率的音频输入,在多个俄语测试集上表现出色。

模型特点

集成语言模型
集成了基于俄语文本语料库构建的2-gram语言模型,显著提高了识别准确率
数据增强训练
训练时应用了音高变换、声音加速/减速、混响等音频增强技术,提高了模型鲁棒性
多数据集评估
在Sberdevices Golos、Common Voice俄语等多个测试集上进行了全面评估

模型能力

俄语语音识别
音频转录
语音转文本

使用案例

语音助手
智能家居控制
用于俄语智能家居设备的语音指令识别
在远场测试集上CER为5.128%
语音转录
会议记录转录
将俄语会议录音自动转录为文字
在众包测试集上WER为6.883%