S

Stt Ru Fastconformer Hybrid Large Pc

由 nvidia 开发
这是一个用于俄语自动语音识别的FastConformer混合模型,结合了Transducer和CTC解码器,参数规模约1.15亿。
下载量 6,513
发布时间 : 5/26/2023
模型介绍
内容详情
替代品

模型简介

该模型能够转录包含大小写俄语字母、空格和基本标点符号的语音,适用于俄语语音识别任务。

模型特点

混合训练架构
同时使用Transducer和CTC两种损失函数进行训练,提高模型鲁棒性
优化的FastConformer
采用8倍深度可分离卷积下采样的优化Conformer架构,提高处理效率
多数据集训练
在包含1840小时俄语语音的复合数据集上训练,覆盖多种语音场景

模型能力

俄语语音识别
标点符号预测
大小写识别

使用案例

语音转录
俄语语音转文本
将俄语语音内容转换为文本格式
在Common Voice 12.0测试集上WER为5.3
语音助手
俄语语音指令识别
识别和理解俄语语音命令
在Golos crowd测试集上WER低至1.9