A

Assignment1 Francesco

由 Classroom-workshop 开发
基于语音到文本转换器(S2T)训练的自动语音识别(ASR)模型,专为英语语音识别设计
下载量 22
发布时间 : 6/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个端到端的序列到序列变换器模型,使用标准的自回归交叉熵损失进行训练,能够将英语语音转换为文本

模型特点

端到端语音识别
直接从语音特征生成文本,无需中间处理步骤
基于变换器架构
采用先进的序列到序列变换器模型,提供高质量的语音识别
自回归生成
使用自回归方式生成转录文本,确保连贯性

模型能力

英语语音识别
端到端语音转文本
实时语音转录

使用案例

语音转录
会议记录
将会议录音自动转换为文字记录
播客转录
将英语播客内容转换为文本格式
辅助技术
实时字幕生成
为视频或直播提供实时英文字幕