T

Test Audio

由 joaogante 开发
一个基于Transformer的端到端语音翻译模型,专门用于法语到英语的语音翻译任务。
下载量 19
发布时间 : 5/16/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个序列到序列的语音到文本转换器,专为法语语音到英语文本的翻译而设计。它使用卷积下采样器处理语音输入,并通过Transformer架构生成翻译文本。

模型特点

端到端语音翻译
直接从语音输入生成翻译文本,无需中间转录步骤。
基于Transformer架构
采用先进的Transformer架构,能够有效捕捉语音和文本之间的长距离依赖关系。
卷积下采样
使用卷积下采样器在语音特征进入编码器前减少其长度,提高处理效率。

模型能力

法语语音识别
法语到英语语音翻译
端到端语音处理

使用案例

语音翻译服务
实时语音翻译
将法语语音实时翻译为英语文本,适用于会议、讲座等场景。
在CoVoST2测试集上达到26.25 BLEU分数
语音内容转录翻译
将法语语音内容转录并翻译为英语文本,用于内容本地化。