H

Hf Seamless M4t Large

由 facebook 开发
SeamlessM4T 是一个支持多语言语音和文本翻译的统一模型,能够实现语音到语音、语音到文本、文本到语音和文本到文本的翻译任务。
下载量 4,648
发布时间 : 9/13/2023
模型介绍
内容详情
替代品

模型简介

SeamlessM4T 是一个旨在提供高质量翻译的模型集合,支持多种语言之间的语音和文本翻译,使不同语言社区的人们能够轻松交流。

模型特点

多任务统一模型
单一模型支持语音到语音、语音到文本、文本到语音和文本到文本的翻译任务,无需依赖多个独立模型。
广泛的语言支持
支持 101 种语言的语音输入、96 种语言的文本输入/输出和 35 种语言的语音输出。
高质量翻译
提供高质量的语音和文本翻译,适用于多种语言对。
灵活的生成策略
支持多种生成策略,如束搜索解码和多项式采样,可根据需求调整生成效果。

模型能力

语音到语音翻译
语音到文本翻译
文本到语音翻译
文本到文本翻译
自动语音识别

使用案例

跨语言交流
实时语音翻译
将一种语言的语音实时翻译为另一种语言的语音或文本,适用于会议、旅行等场景。
高质量的多语言语音输出
多语言内容生成
将文本或语音内容翻译为多种语言,用于生成多语言媒体内容。
支持多种语言的文本和语音输出
语音处理
语音识别
将语音转换为文本,支持多种语言的语音输入。
高准确率的语音识别
语音合成
将文本转换为语音,支持多种语言的语音输出。
自然的语音合成效果