A
Aurora 1.6b
由 Lorenzob 开发
基于Dia-1.6B微调的多语种情感与歌唱语音合成模型,支持音色克隆和情感控制
下载量 103
发布时间 : 5/6/2025
模型简介
Aurora-1.6B是一个多语言文本转语音模型,具备情感调节、歌唱合成和零样本音色克隆能力,支持多种欧洲语言。
模型特点
多语种支持
流畅合成意大利语、英语、波兰语、德语、法语等多种语言的语音
情感调控
通过说话人标签或情感标记精确调节语音表现力
歌唱功能
通过输入歌唱提示或风格参考,生成具有旋律性的人声演唱
零样本音色克隆
仅需短音频样本即可克隆任意说话人的音色特征
拟声词合成
支持内联合成真实非语言声音效果,如笑声、咳嗽声或叹息声
模型能力
多语言语音合成
情感语音生成
歌唱语音合成
音色克隆
非语言声音合成
使用案例
娱乐应用
歌曲生成
根据文本提示生成歌唱片段
可生成如《生日快乐歌》等简单歌曲
有声读物制作
为多语言书籍生成带情感的朗读音频
可调节不同角色的声音和情感表现
辅助工具
语音助手
为对话系统提供更自然的语音输出
支持情感表达和个性化音色
无障碍应用
为视障用户提供多语言语音支持
可调节语速和情感表达
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文