W

Wav2vec2 Xls R 1b En To 15

由 facebook 开发
Facebook的Wav2Vec2 XLS-R模型微调用于语音翻译任务,支持15种语言从英语到目标语言的翻译。
下载量 505
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个语音编码器-解码器模型,能够将英语口语翻译为15种不同的书面语言。编码器基于facebook/wav2vec2-xls-r-1b,解码器基于facebook/mbart-large-50,并在Covost2数据集上进行了微调。

模型特点

多语言支持
支持从英语到15种不同语言的语音翻译。
基于XLS-R架构
利用大规模自监督学习的XLS-R架构,提供高质量的语音表示。
端到端翻译
直接从语音输入生成目标语言的文本输出,无需中间转录步骤。

模型能力

英语语音识别
多语言文本生成
语音到文本翻译

使用案例

语音翻译
实时语音翻译
将英语口语实时翻译为多种目标语言的文本。
在Covost2数据集上表现出色。
多语言字幕生成
为英语视频内容自动生成多语言字幕。