I

Indicconformer Stt Kn Hybrid Ctc Rnnt Large

由 ai4bharat 开发
IndicConformer 是一个基于混合 CTC-RNNT 架构的 Conformer 自动语音识别(ASR)模型,专门用于卡纳达语语音识别。
下载量 130
发布时间 : 9/5/2024
模型介绍
内容详情
替代品

模型简介

该模型是一个 Conformer-Large 架构,包含 1.2 亿参数,采用混合 CTC-RNNT 解码器,能够将卡纳达语语音转换为文本。

模型特点

混合 CTC-RNNT 解码器
结合 CTC 和 RNNT 解码器的优势,提高语音识别的准确性和鲁棒性。
高性能 Conformer 架构
采用 Conformer-Large 架构,包含 17 个 Conformer 模块,模型维度为 512,能够高效处理语音信号。
卡纳达语支持
专门针对卡纳达语优化,能够准确识别卡纳达语语音。

模型能力

语音识别
卡纳达语语音转文本

使用案例

语音转文本
卡纳达语语音转录
将卡纳达语语音转换为文本,适用于语音助手、字幕生成等场景。