I

Indicconformer Stt Te Hybrid Ctc Rnnt Large

由 ai4bharat 开发
IndicConformer是一款基于混合CTC-RNNT架构的Conformer自动语音识别(ASR)模型,支持泰卢固语语音识别。
下载量 1,244
发布时间 : 9/5/2024
模型介绍
内容详情
替代品

模型简介

该模型采用Conformer-Large架构,专为泰卢固语语音识别设计,能够将16KHz单声道音频转换为文本。

模型特点

混合解码器架构
结合CTC和RNNT两种解码器,提供更准确的语音识别结果
大模型容量
1.2亿参数的Conformer-Large架构,具有强大的语音识别能力
特定语言优化
专门针对泰卢固语进行优化训练

模型能力

泰卢固语语音识别
音频转文本
混合解码器推理

使用案例

语音转录
泰卢固语语音转文字
将泰卢固语语音内容转换为文本格式
高准确率的转录文本
语音助手
泰卢固语语音交互
为泰卢固语语音助手提供语音识别能力