S

S2t Wav2vec2 Large En Ca

由 facebook 开发
这是一个基于Transformer的端到端语音翻译模型,专为英语到加泰罗尼亚语的语音翻译任务设计。
下载量 35
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型采用预训练的Wav2Vec2作为编码器,搭配Transformer解码器,能够直接将英语语音翻译为加泰罗尼亚语文本。

模型特点

端到端语音翻译
直接从语音输入生成目标语言文本,无需中间转录步骤
基于Wav2Vec2预训练
利用大规模自监督预训练的Wav2Vec2作为语音编码器
Transformer架构
采用标准的Transformer解码器进行序列生成

模型能力

英语语音识别
英语到加泰罗尼亚语翻译
端到端语音翻译

使用案例

语音翻译
实时语音翻译
将英语语音实时翻译为加泰罗尼亚语文本
在CoVoST-V2测试集上达到34.1 BLEU分数
语音转录与翻译
将英语语音内容转录并翻译为加泰罗尼亚语