S

Seamless M4t V2 Large

由 audo 开发
SeamlessM4T是一个大规模多语言多模态机器翻译模型,支持近100种语言的语音和文本翻译。
下载量 39
发布时间 : 12/3/2023
模型介绍
内容详情
替代品

模型简介

SeamlessM4T是一个基础的一体化多语言多模态机器翻译模型,为语音和文本提供高质量翻译。支持语音到语音、语音到文本、文本到语音、文本到文本翻译以及自动语音识别等多种任务。

模型特点

多语言支持
支持101种语言的语音输入和96种语言的文本输入/输出,覆盖全球主要语言
多模态翻译
支持语音到语音、语音到文本、文本到语音和文本到文本等多种翻译模式
高质量翻译
采用新颖的UnitY2架构,在质量和推理速度上均优于前代版本
快速推理
通过分层的字符到单元上采样和非自回归文本到单元解码,显著提升推理速度

模型能力

语音识别
语音合成
文本翻译
语音翻译
多语言处理

使用案例

实时翻译
会议实时翻译
在跨国会议中提供实时语音翻译服务
支持多种语言的实时互译
语音助手
为智能设备提供多语言语音交互能力
实现跨语言的自然对话
内容本地化
视频字幕生成
自动生成多语言视频字幕
提高内容可访问性
多语言播客
将播客内容翻译成多种语言版本
扩大受众覆盖面