H

Hf Seamless M4t Large

由 facebook 开发
SeamlessM4T 是一个支持多语言语音和文本翻译的统一模型,能够实现语音到语音、语音到文本、文本到语音和文本到文本的翻译任务。
下载量 4,648
发布时间 : 9/13/2023

模型简介

SeamlessM4T 是一个旨在提供高质量翻译的模型集合,支持多种语言之间的语音和文本翻译,使不同语言社区的人们能够轻松交流。

模型特点

多任务统一模型
单一模型支持语音到语音、语音到文本、文本到语音和文本到文本的翻译任务,无需依赖多个独立模型。
广泛的语言支持
支持 101 种语言的语音输入、96 种语言的文本输入/输出和 35 种语言的语音输出。
高质量翻译
提供高质量的语音和文本翻译,适用于多种语言对。
灵活的生成策略
支持多种生成策略,如束搜索解码和多项式采样,可根据需求调整生成效果。

模型能力

语音到语音翻译
语音到文本翻译
文本到语音翻译
文本到文本翻译
自动语音识别

使用案例

跨语言交流
实时语音翻译
将一种语言的语音实时翻译为另一种语言的语音或文本,适用于会议、旅行等场景。
高质量的多语言语音输出
多语言内容生成
将文本或语音内容翻译为多种语言,用于生成多语言媒体内容。
支持多种语言的文本和语音输出
语音处理
语音识别
将语音转换为文本,支持多种语言的语音输入。
高准确率的语音识别
语音合成
将文本转换为语音,支持多种语言的语音输出。
自然的语音合成效果
AIbase
智启未来,您的人工智能解决方案智库
简体中文