P

Parler Tts Large V1

由 parler-tts 开发
拥有22亿参数的文本转语音模型,基于4.5万小时音频数据训练,支持通过文本提示控制语音特征
下载量 28.69k
发布时间 : 8/8/2024
模型介绍
内容详情
替代品

模型简介

高质量文本转语音模型,可通过自然语言描述控制性别、背景噪音、语速等特征,支持34个预设说话人音色

模型特点

自然语言控制
通过文本描述即可控制语音的性别、背景噪音、语速、音高等特征
预设说话人
内置34个特征鲜明的说话人音色(如Jon、Lea等),确保语音一致性
高质量输出
基于4.5万小时专业音频数据训练,生成语音自然流畅
完全开源
包含训练代码、数据集和模型权重全部开放

模型能力

文本转语音合成
语音特征控制
多音色生成
韵律控制

使用案例

内容创作
有声内容制作
为播客、视频配音生成自然语音
高质量、可控制特征的语音输出
辅助技术
无障碍阅读
将文本内容转换为语音输出
支持个性化语音特征设置