A

Assignment1 Joane

由 Classroom-workshop 开发
一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型
下载量 22
发布时间 : 6/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个端到端的序列到序列转换器模型,使用标准的自回归交叉熵损失进行训练,并自回归生成转录文本。

模型特点

端到端模型
直接从语音特征生成文本,无需中间处理步骤
高准确率
在LibriSpeech测试集上取得4.3(WER, clean)和9.0(WER, other)的优秀表现
自回归生成
使用自回归方式生成转录文本,提高生成质量

模型能力

英语语音识别
端到端语音转文本
实时语音转录

使用案例

语音转录
会议记录
将会议录音自动转换为文字记录
高准确率的转录文本
语音笔记
将语音备忘录转换为可搜索的文本
便于检索和整理的文本内容
辅助技术
听力辅助
为听力障碍者提供实时字幕
提高可访问性