S

Stt Uk Citrinet 1024 Gamma 0 25

由 nvidia 开发
这是一个用于乌克兰语自动语音识别(ASR)的流式Citrinet模型,拥有1.41亿参数,在69小时的乌克兰语音数据上训练,测试WER低至3.52%。
下载量 65
发布时间 : 7/27/2022
模型介绍
内容详情
替代品

模型简介

该模型是流式Citrinet的非自回归变体,使用CTC损失/解码,能够转录包含空格和撇号的乌克兰语小写字母语音。

模型特点

跨语言迁移学习
该模型从预训练的俄语Citrinet-1024模型通过跨语言迁移学习方法微调而来
高性能
在多个版本的Mozilla Common Voice测试集上WER表现优异,最低达到3.52%
流式处理
支持流式语音识别,适合实时应用场景
Riva兼容
兼容NVIDIA Riva,可用于生产级服务器部署

模型能力

乌克兰语语音识别
实时语音转录
音频文件批量处理

使用案例

语音转录
语音转文字服务
将乌克兰语语音内容转换为文字
高准确率转录,WER低至3.52%
实时应用
实时字幕生成
为乌克兰语视频或直播生成实时字幕
流式处理能力支持低延迟应用