W

Wav2vec2 Xls R 1b 21 To En

由 facebook 开发
Facebook的Wav2Vec2 XLS-R模型,用于多语言语音到英语的翻译任务
下载量 511
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于SpeechEncoderDecoder架构的模型,能够将21种语言的语音翻译成英语。编码器基于facebook/wav2vec2-xls-r-1b,解码器基于facebook/mbart-large-50,在Covost2数据集上进行了微调。

模型特点

多语言支持
支持21种语言到英语的语音翻译
大规模预训练
基于20亿参数的XLS-R模型,具有强大的语音特征提取能力
端到端翻译
直接从语音到目标语言文本的端到端翻译

模型能力

语音识别
多语言翻译
语音到文本转换

使用案例

语音翻译
实时语音翻译
将会议、演讲等场合的实时语音翻译成英语
在Covost2数据集上表现优异
多语言语音助手
为语音助手提供多语言输入支持