D

Dia 1.6B

由 nari-labs 开发
Dia是由Nari实验室开发的16亿参数文本转语音模型,能够直接从文本生成高度逼真的对话,支持情感和语调控制,并能生成非语言交流内容。
下载量 80.28k
发布时间 : 4/20/2025
模型介绍
内容详情
替代品

模型简介

Dia是一款开源权重的文本对话模型,支持通过音频条件化输出实现情感和语调控制,并能生成非语言交流内容如笑声、咳嗽等。

模型特点

高度逼真的对话生成
能够直接从文本生成高度逼真的对话,支持情感和语调控制。
非语言交流生成
能生成非语言交流内容,如笑声、咳嗽、清嗓等。
语音克隆
支持语音克隆功能,可通过上传待克隆音频实现声音复制。
开源权重
模型权重完全开源,用户可完全控制脚本和语音。

模型能力

文本转语音
情感和语调控制
非语言交流生成
语音克隆

使用案例

对话生成
Dia介绍
生成介绍Dia模型的对话内容
高度逼真的对话效果
紧急预案
生成紧急情况下的对话内容
情感丰富的语音输出
语音克隆
自定义语音
通过上传音频克隆特定声音
生成与克隆声音相似的语音