S

Stt Fa Fastconformer Hybrid Large

由 nvidia 开发
这是一个用于波斯语自动语音识别(ASR)的混合模型,结合了传感器和CTC解码器损失,基于FastConformer架构优化。
下载量 2,398
发布时间 : 11/21/2023
模型介绍
内容详情
替代品

模型简介

该模型用于将波斯语语音转录为文本,是FastConformer传感器-CTC模型的'大'版本,具有115M参数。

模型特点

混合训练
同时使用传感器和CTC解码器损失进行训练,提高模型鲁棒性
优化架构
基于FastConformer架构,具有8倍深度可分离卷积下采样
高准确率
在波斯语测试集上达到13.16% WER和3.85% CER的优异表现

模型能力

波斯语语音识别
音频转录
实时语音处理

使用案例

语音转文字
波斯语语音转录
将波斯语语音转换为文本
在CommonVoice测试集上达到13.16% WER
语音助手
波斯语语音命令识别
用于开发波斯语语音助手