P

Parler Tts

由 ipsilondev 开发
Parler-TTS Mini v0.1 是一个轻量级的文本转语音模型,基于10.5K小时的音频数据训练而成,能够生成高质量、自然流畅的语音,并通过简单的文本提示控制语音特征。
下载量 18
发布时间 : 4/23/2024
模型介绍
内容详情
替代品

模型简介

这是一个完全开源的文本转语音模型,能够通过文本提示控制语音的性别、背景噪音、语速、音调和混响效果等特征。

模型特点

高质量语音生成
基于10.5K小时的音频数据训练,能够生成高质量、自然流畅的语音
语音特征控制
通过简单的文本提示控制语音特征,如性别、背景噪音、语速、音调和混响效果
完全开源
所有数据集、预处理、训练代码和权重均在宽松许可下公开
韵律控制
可以使用标点符号控制生成的韵律,例如使用逗号在语音中添加短暂停顿

模型能力

文本转语音
语音特征控制
韵律控制

使用案例

语音合成
个性化语音生成
根据用户需求生成不同性别、语速和音调的语音
生成自然流畅的个性化语音
有声读物制作
快速将文本内容转换为语音,用于有声读物制作
高效生成高质量的有声内容
辅助技术
语音辅助设备
为视障人士或其他需要语音辅助的用户提供支持
生成清晰可理解的语音输出