J

Jets

由 imdanboy 开发
基于ESPnet框架训练的JETS文本转语音模型,使用LJSpeech数据集训练,支持英文语音合成。
下载量 15
发布时间 : 5/28/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于JETS架构的文本转语音模型,能够将英文文本转换为自然语音。模型采用对抗训练策略,结合了Transformer编码器和HiFiGAN判别器,生成高质量的语音输出。

模型特点

高质量语音合成
采用JETS架构结合HiFiGAN判别器,生成自然流畅的语音
对抗训练策略
使用生成对抗网络(GAN)训练方法,提高语音质量
端到端训练
从文本直接到语音波形的端到端训练流程
多尺度判别器
使用多尺度多周期判别器(Multi-Scale Multi-Period Discriminator)提升生成质量

模型能力

英文文本转语音
高质量语音合成
语音特征控制(音高、能量)

使用案例

语音合成应用
有声读物生成
将电子书文本转换为自然语音
生成接近人类朗读的语音
语音助手
为虚拟助手提供语音输出能力
自然流畅的对话语音