A

Asr Crdnn Rnnlm Librispeech

由 speechbrain 开发
这是一个基于LibriSpeech数据集预训练的端到端自动语音识别系统,采用CRDNN架构结合CTC/注意力机制和RNN语言模型,在英文语音识别任务上表现优异。
下载量 1,354
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个完整的自动语音识别系统,包含分词器、神经语言模型和声学模型,能够将英文语音转换为文本。

模型特点

多模块集成
整合了分词器、RNN语言模型和CRDNN声学模型,提供完整的语音识别解决方案
双重解码机制
同时采用CTC和注意力机制进行解码,提高识别准确率
高效训练
在LibriSpeech数据集上训练,使用卷积神经网络块和双向LSTM提取声学特征

模型能力

英语语音识别
音频转录
语音转文本

使用案例

语音转录
音频文件转录
将英语语音文件转换为文本
在LibriSpeech测试集上达到3.09%的词错误率