S

Seamless M4t V2 Large

由 facebook 开发
SeamlessM4T v2 是 Facebook 发布的大规模多语言多模态机器翻译模型,支持近100种语言的语音和文本翻译。
下载量 64.59k
发布时间 : 11/29/2023
模型介绍
内容详情
替代品

模型简介

SeamlessM4T 是一个全能的大规模多语言多模态机器翻译模型,为语音和文本提供高质量的翻译服务。支持语音到语音、语音到文本、文本到语音、文本到文本翻译以及自动语音识别等多种任务。

模型特点

多语言支持
支持101种语言的语音输入、96种语言的文本输入/输出、35种语言的语音输出。
多模态翻译
支持语音到语音、语音到文本、文本到语音、文本到文本翻译以及自动语音识别等多种任务。
高质量翻译
采用新型UnitY2架构,在质量和语音生成任务的推理速度上均优于前代版本。
快速推理
通过分层的字符到单元上采样和非自回归的文本到单元解码,显著提升推理速度。

模型能力

语音到语音翻译
语音到文本翻译
文本到语音翻译
文本到文本翻译
自动语音识别

使用案例

翻译服务
多语言会议翻译
实时将会议中的语音翻译成多种语言的文本或语音输出。
高质量的多语言翻译,提升会议效率和沟通效果。
语音内容转录
将语音内容自动转录为文本,支持多种语言。
准确的语音识别和转录,适用于字幕生成、会议记录等场景。
教育
语言学习辅助
帮助学习者通过语音和文本的互译进行语言学习。
提供高质量的多语言翻译,辅助语言学习。