B

Bark Small

由 suno 开发
Bark是由Suno开发的基于Transformer的多语言文本转音频模型,能生成逼真语音、音乐及非语言声音
下载量 22.74k
发布时间 : 7/18/2023
模型介绍
内容详情
替代品

模型简介

基于Transformer架构的文本转音频模型,支持多语言语音合成及背景音效生成,可模拟笑声、叹息等非语言交流

模型特点

多语言支持
支持13种语言的语音合成,包括中文、日语等非拉丁语系语言
非语言表达
可模拟笑声、叹息、哭泣等人类非语言交流声音
背景音效生成
除语音外还能生成音乐、环境噪音等辅助音效
研究友好
提供预训练模型检查点及优化方案,便于学术研究

模型能力

文本转语音
多语言合成
情感音效生成
背景音乐生成
非语言声音模拟

使用案例

无障碍工具
多语言朗读辅助
为视障用户提供多语言内容语音输出
支持13种语言的流畅语音转换
内容创作
播客音效生成
自动生成带背景音乐的语音内容
可生成带有情感表达和音效的完整音频