A

Aurora 1.6b

由 Lorenzob 开发
基于Dia-1.6B微调的多语种情感与歌唱语音合成模型,支持音色克隆和情感控制
下载量 103
发布时间 : 5/6/2025
模型介绍
内容详情
替代品

模型简介

Aurora-1.6B是一个多语言文本转语音模型,具备情感调节、歌唱合成和零样本音色克隆能力,支持多种欧洲语言。

模型特点

多语种支持
流畅合成意大利语、英语、波兰语、德语、法语等多种语言的语音
情感调控
通过说话人标签或情感标记精确调节语音表现力
歌唱功能
通过输入歌唱提示或风格参考,生成具有旋律性的人声演唱
零样本音色克隆
仅需短音频样本即可克隆任意说话人的音色特征
拟声词合成
支持内联合成真实非语言声音效果,如笑声、咳嗽声或叹息声

模型能力

多语言语音合成
情感语音生成
歌唱语音合成
音色克隆
非语言声音合成

使用案例

娱乐应用
歌曲生成
根据文本提示生成歌唱片段
可生成如《生日快乐歌》等简单歌曲
有声读物制作
为多语言书籍生成带情感的朗读音频
可调节不同角色的声音和情感表现
辅助工具
语音助手
为对话系统提供更自然的语音输出
支持情感表达和个性化音色
无障碍应用
为视障用户提供多语言语音支持
可调节语速和情感表达