I

Indicconformer Stt Ur Hybrid Ctc Rnnt Large

由 ai4bharat 开发
IndicConformer 是一个基于混合 CTC-RNNT 架构的 Conformer 自动语音识别模型,专门用于乌尔都语语音转录。
下载量 44
发布时间 : 9/5/2024
模型介绍
内容详情
替代品

模型简介

该模型采用 Conformer-Large 架构,支持乌尔都语语音识别,能够将16kHz单声道音频转换为文本。

模型特点

混合解码架构
同时支持CTC和RNNT两种解码方式,提供更灵活的推理选择
大模型容量
1.2亿参数的Conformer-Large架构,提供强大的语音识别能力
乌尔都语优化
专门针对乌尔都语语音特点进行优化的模型

模型能力

乌尔都语语音识别
音频转录
混合解码(CTC/RNNT)

使用案例

语音转录
乌尔都语语音转文字
将乌尔都语语音内容转换为文本
高准确率的转录文本
语音助手
乌尔都语语音交互
为乌尔都语语音助手提供识别能力