MOSS-TTSD-v0.5开源双语口语合成模型 - 免费将对话脚本转为自然语音

首页

MOSS TTSD V0.5

由 fnlp 开发

MOSS-TTSD 是一个开源的双语口语对话合成模型，支持中文和英文，能够将对话脚本转化为自然、富有表现力的对话语音。

语音合成

Safetensors

支持多种语言开源协议:Apache-2.0 #双语对话合成 #零样本语音克隆 #高表现力语音

下载量 182

发布时间 : 7/4/2025

模型简介

MOSS-TTSD 是一个文本转口语对话（TTSD）模型，专门用于生成两人之间的自然对话语音，适用于AI播客制作等场景。

模型特点

高度富有表现力的对话语音

基于数百万小时的TTS数据及40万小时的合成和真实对话语音训练，能生成类似人类的对话语音，具有自然的对话韵律。

双说话人语音克隆

支持零样本双说话人语音克隆，并能根据对话脚本准确切换说话人。

中英双语支持

能够生成富有表现力的中文和英文语音。

长语音生成

能够单会话生成最长达960秒的语音。

完全开源且可商用

采用Apache-2.0许可证，支持免费商业使用。

模型能力

文本转语音

对话语音合成

双语语音生成

语音克隆

长语音生成

使用案例

内容创作

AI播客制作

将对话脚本自动转换为自然流畅的播客语音

生成富有表现力的对话语音，提升听众体验

语音交互

虚拟助手对话

为虚拟助手生成更自然的对话语音

提高人机交互的自然度和友好性

属性	详情
基础模型	Qwen/Qwen3 - 1.7B - Base
任务类型	文本转语音
许可证	Apache-2.0

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

MOSS TTSD V0.5

模型简介

模型特点

模型能力

使用案例

🚀 MOSS-TTSD

🚀 快速开始

✨ 主要特性

📄 许可证

🔍 信息表格