A

Asr Transformer Transformerlm Librispeech

由 speechbrain 开发
这是一个基于Transformer架构的自动语音识别(ASR)系统,结合了CTC和Transformer解码器,在LibriSpeech英文数据集上训练。
下载量 533
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个端到端的自动语音识别系统,包含分词器、神经语言模型和声学模型,支持英文语音转录。

模型特点

联合解码
结合CTC概率和Transformer解码器进行联合解码,提高识别准确率
子词单元处理
使用unigram分词器将单词转换为子词单元,提高模型处理能力
高性能
在LibriSpeech测试集上达到2.27(干净)和5.53(其他)的词错误率(WER)

模型能力

英文语音识别
音频转录
自动语音识别

使用案例

语音转录
音频文件转录
将英文语音文件转换为文本
高准确率的转录结果
语音处理
语音识别系统
集成到语音识别应用中
提供准确的语音转文本功能