A

Asr Conformer Largescaleasr

由 speechbrain 开发
这是一个基于SpeechBrain框架训练的端到端自动语音识别系统,使用Conformer架构在25,000小时英文语音数据上训练。
下载量 92
发布时间 : 2/6/2025
模型介绍
内容详情
替代品

模型简介

该模型是一个高性能的自动语音识别系统,结合了Conformer编码器和CTC+Transformer联合解码器,支持英文语音转录。

模型特点

大规模训练数据
基于25,000小时的LargeScaleASR数据集训练,涵盖多种语音场景
高效架构
采用Conformer架构,结合了CNN和Transformer的优势,适合语音识别任务
灵活解码
支持多种解码方式,包括大波束宽度全解码、贪婪解码和仅注意力解码

模型能力

英文语音识别
音频转录
语音转文本

使用案例

语音转录
会议记录
将会议录音自动转录为文字记录
验证集WER 6.8,测试集WER 7.5
语音笔记
将语音笔记转换为可搜索的文本
辅助技术
实时字幕生成
为视频或直播内容生成实时字幕