W

Wav2vec2 Xls R 2b 22 To 16

由 facebook 开发
Facebook的Wav2Vec2 XLS-R模型微调用于多语言语音翻译任务,支持22种输入语言和16种输出语言的互译。
下载量 38
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于SpeechEncoderDecoder架构的语音翻译模型,能够将多种口语语言翻译为书面语言。编码器基于wav2vec2-xls-r-2b,解码器基于mbart-large-50,在Covost2数据集上微调。

模型特点

多语言支持
支持22种输入语言和16种输出语言的互译,覆盖广泛的语言需求
大规模预训练
基于20亿参数的Wav2Vec2-XLS-R模型,具有强大的语音特征提取能力
端到端翻译
直接从语音到目标语言文本的翻译,无需中间转录步骤

模型能力

语音识别
多语言翻译
语音到文本转换

使用案例

国际交流
实时语音翻译
将会议或对话中的语音实时翻译为其他语言
支持多种语言组合的准确翻译
媒体处理
视频字幕生成
为外语视频自动生成翻译字幕
支持多种语言对的字幕生成