A

Asr Transformer Aishell

由 speechbrain 开发
基于SpeechBrain框架预训练的AISHELL(普通话)端到端自动语音识别系统,采用Transformer编码器+联合解码器结构
下载量 76
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个用于普通话自动语音识别的Transformer模型,基于AISHELL数据集训练,能够将中文语音转换为文本。

模型特点

联合解码机制
结合CTC和Transformer解码器,在解码过程中融合CTC概率得分,提高识别准确率
子词单元分词
使用基于unigram算法的分词器,将词语转换为子词单元,提高模型对词汇的泛化能力
自动音频处理
内置音频标准化处理,包括自动重采样和单声道选择,简化使用流程

模型能力

普通话语音识别
音频转录
批量语音处理

使用案例

语音转录
中文会议记录
将中文会议录音自动转换为文字记录
测试集CER为6.04%
语音输入系统
为中文应用提供语音输入功能