S

Stt Es Conformer Ctc Large

由 nvidia 开发
这是一个用于西班牙语自动语音识别(ASR)的大型Conformer-CTC模型,由NVIDIA训练并发布。
下载量 59
发布时间 : 7/8/2022
模型介绍
内容详情
替代品

模型简介

该模型用于转录包含空格的小写西班牙语字母的语音,基于Conformer架构,使用CTC损失/解码方法。

模型特点

高性能识别
在多个测试集上表现出色,如Common Voice 7.0测试集WER为5.5%
大训练数据集
使用1340小时的西班牙语语音数据进行训练
兼容Riva部署
可与NVIDIA Riva配合使用,实现生产级服务器部署
非自回归架构
采用Conformer-CTC的非自回归架构,约1.2亿参数

模型能力

西班牙语语音识别
音频转录
支持16kHz单声道音频输入

使用案例

语音转文字
语音转录服务
将西班牙语语音内容转换为文本
高准确率的转录结果
语音助手
西班牙语语音助手
用于开发西班牙语语音助手