I

Indicconformer Stt Gu Hybrid Ctc Rnnt Large

由 ai4bharat 开发
IndicConformer 是一个基于混合 CTC-RNNT 架构的 Conformer 自动语音识别(ASR)模型,专门用于古吉拉特语的语音转录。
下载量 340
发布时间 : 9/5/2024
模型介绍
内容详情
替代品

模型简介

该模型采用 Conformer-Large 架构,能够将16kHz单声道音频中的古吉拉特语语音转录为文本。

模型特点

混合解码架构
同时支持CTC和RNNT两种解码方式,提供更灵活的推理选项
大模型容量
1.2亿参数的编码器结构,具备强大的语音特征提取能力
专门优化
针对古吉拉特语进行专门训练和优化

模型能力

古吉拉特语语音识别
16kHz音频处理
单声道音频转录

使用案例

语音转文字
古吉拉特语会议记录
将古吉拉特语会议录音自动转录为文字记录
生成准确的会议文字记录
语音助手
为古吉拉特语用户提供语音输入支持
实现古吉拉特语语音交互