W

Wav2vec2 Xls R 300m En To 15

由 facebook 开发
Facebook的Wav2Vec2 XLS-R模型微调用于多语言语音翻译任务,支持15种语言的英语到目标语言的翻译。
下载量 167
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于SpeechEncoderDecoderModel的语音翻译模型,能够将英语口语翻译为15种不同的书面语言。

模型特点

多语言支持
支持15种语言的英语到目标语言的翻译
基于XLS-R架构
采用先进的Wav2Vec2 XLS-R 300M模型作为编码器
端到端语音翻译
直接从语音输入到文本输出的翻译流程

模型能力

英语语音识别
多语言文本翻译
语音到文本转换

使用案例

语音翻译
英语到德语翻译
将英语口语实时翻译为德语文本
在Covost2数据集上表现良好
多语言会议记录
将英语会议录音翻译为多种语言的文本记录