A

Assignment1 Maria

由 Classroom-workshop 开发
s2t-small-librispeech-asr 是一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型,基于序列到序列的转换器架构。
下载量 23
发布时间 : 6/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个端到端的序列到序列转换器模型,使用标准的自回归交叉熵损失进行训练,并自回归地生成转录文本。主要用于英语语音识别任务。

模型特点

端到端语音识别
采用序列到序列架构,直接从语音特征生成文本,无需中间处理步骤。
高准确率
在LibriSpeech测试集上取得4.3(clean)和9.0(other)的WER(词错误率)。
易于使用
提供简单的API接口,只需几行代码即可实现语音识别功能。

模型能力

英语语音识别
端到端语音转文本
实时语音转录

使用案例

语音转录
会议记录
将会议录音自动转录为文字记录
准确率高达95.7%(在LibriSpeech clean测试集上)
语音助手
为语音助手提供语音识别能力
教育
讲座转录
将教育讲座内容自动转录为文字