H

Handler

由 walterheart 开发
Bark是由Suno创建的基于Transformer的文本转音频模型,可生成高度逼真的多语言语音、音乐、背景噪音和音效。
下载量 20
发布时间 : 4/30/2025
模型介绍
内容详情
替代品

模型简介

Bark是一个先进的文本转语音模型,能够生成多语言语音、音乐、背景噪音和简单音效,还支持非语言交流如笑声、叹息和哭泣。

模型特点

多语言支持
支持13种语言的语音生成,包括主要欧洲和亚洲语言
多功能音频生成
不仅能生成语音,还能生成音乐、背景噪音和简单音效
非语言交流
可生成笑声、叹息、哭泣等非语言交流声音
高质量输出
生成24kHz采样率的高质量音频

模型能力

文本转语音
多语言语音合成
背景音乐生成
音效生成
非语言声音生成

使用案例

辅助工具
语音辅助应用
为视障人士或有阅读困难者提供语音输出
高度逼真的语音输出
内容创作
播客和有声读物
自动生成多语言的有声内容和旁白
自然流畅的语音输出
游戏音效
为游戏生成背景音乐和音效
多样化的音频效果