P

Parler Tts Mini V1 Paraspeechcaps

由 ajd12342 开发
基于Parler-TTS Mini v1微调的文本转语音模型,支持通过风格提示控制语音输出
下载量 139
发布时间 : 2/27/2025
模型介绍
内容详情
替代品

模型简介

该模型在ParaSpeechCaps数据集上微调,能够通过文本风格提示(如音高、节奏、清晰度、情感等)生成丰富风格的语音输出。

模型特点

风格控制
支持通过文本提示精确控制语音输出的风格特征(如音高、节奏、情感等)
大规模风格标注
基于ParaSpeechCaps数据集训练,包含59种风格标签的丰富标注
多模态训练
结合文本和语音嵌入器、分类器以及音频语言模型的新颖训练流程

模型能力

文本转语音
语音风格控制
多风格语音生成

使用案例

语音合成
情感化语音生成
根据文本提示生成带有特定情感的语音
可生成悲伤、快乐等不同情感的语音输出
风格化语音创作
为影视、游戏等创作具有特定风格的语音
可控制语速、清晰度等参数生成专业级语音
辅助技术
无障碍语音合成
为视障用户提供可定制的语音输出
可根据用户偏好调整语音特征