S

Seamless M4t V2 Large

由 audo 开发
SeamlessM4T是一个大规模多语言多模态机器翻译模型,支持近100种语言的语音和文本翻译。
下载量 39
发布时间 : 12/3/2023

模型简介

SeamlessM4T是一个基础的一体化多语言多模态机器翻译模型,为语音和文本提供高质量翻译。支持语音到语音、语音到文本、文本到语音、文本到文本翻译以及自动语音识别等多种任务。

模型特点

多语言支持
支持101种语言的语音输入和96种语言的文本输入/输出,覆盖全球主要语言
多模态翻译
支持语音到语音、语音到文本、文本到语音和文本到文本等多种翻译模式
高质量翻译
采用新颖的UnitY2架构,在质量和推理速度上均优于前代版本
快速推理
通过分层的字符到单元上采样和非自回归文本到单元解码,显著提升推理速度

模型能力

语音识别
语音合成
文本翻译
语音翻译
多语言处理

使用案例

实时翻译
会议实时翻译
在跨国会议中提供实时语音翻译服务
支持多种语言的实时互译
语音助手
为智能设备提供多语言语音交互能力
实现跨语言的自然对话
内容本地化
视频字幕生成
自动生成多语言视频字幕
提高内容可访问性
多语言播客
将播客内容翻译成多种语言版本
扩大受众覆盖面
AIbase
智启未来,您的人工智能解决方案智库
简体中文