T

Tts En Fastpitch

由 nvidia 开发
FastPitch是一种完全并行的Transformer架构文本转语音模型,能够控制音高和音素持续时间,生成高质量的英语美式语音。
下载量 4,701
发布时间 : 6/28/2022
模型介绍
内容详情
替代品

模型简介

基于Transformer的并行TTS模型,通过预测音高轮廓生成富有表现力的语音,支持实时语音合成。

模型特点

全并行架构
基于Transformer的完全并行设计,实现高效的语音合成
音高控制
可预测和调节音高轮廓,生成更具表现力的语音
实时合成
相比传统Tacotron2模型具有更高的实时因子
无监督对齐
采用无监督的语音-文本对齐器,提高合成准确性

模型能力

英语文本转语音
音高控制
实时语音合成
梅尔频谱图生成

使用案例

语音合成
语音助手
为虚拟助手生成自然流畅的语音响应
生成富有表现力的美式英语语音
有声读物
将文本内容转换为语音,用于有声读物制作
可调节音高和语速,增强听感体验