I

Indicconformer Stt Ne Hybrid Ctc Rnnt Large

由 ai4bharat 开发
IndicConformer是一个基于混合CTC-RNNT架构的Conformer自动语音识别模型,专门针对尼泊尔语优化
下载量 36
发布时间 : 9/5/2024
模型介绍
内容详情
替代品

模型简介

该模型采用Conformer-Large结构作为编码器,支持尼泊尔语语音内容转录为文本

模型特点

混合解码架构
同时支持CTC和RNNT两种解码方式,提供更灵活的推理选择
大容量模型
采用1.2亿参数的Conformer-Large架构,特征维度512,确保识别精度
专业语言支持
专门针对尼泊尔语优化的语音识别模型

模型能力

尼泊尔语语音转文本
16kHz单声道音频处理

使用案例

语音转录
尼泊尔语会议记录
将尼泊尔语会议录音自动转录为文字记录
语音助手
为尼泊尔语语音助手提供语音识别能力