I

Indicconformer Stt Hi Hybrid Ctc Rnnt Large

由 ai4bharat 开发
IndicConformer是一个基于混合CTC-RNNT架构的Conformer自动语音识别(ASR)模型,支持印地语语音转录。
下载量 1,694
发布时间 : 9/5/2024
模型介绍
内容详情
替代品

模型简介

该模型采用Conformer-Large架构,专为印地语自动语音识别任务设计,能够将16kHz单声道音频转换为文本。

模型特点

混合解码架构
同时支持CTC和RNNT两种解码方式,提供更灵活的推理选择
大参数规模
1.2亿参数的Conformer-Large架构,具备强大的语音识别能力
专业语言支持
专门针对印地语优化的语音识别模型

模型能力

印地语语音识别
音频转文本
支持CTC解码
支持RNNT解码

使用案例

语音转录
印地语语音转文字
将印地语语音内容转换为可编辑的文本格式
高准确率的印地语转录结果
语音助手
印地语语音交互
为印地语语音助手提供核心识别能力