fastspeech2_conformer_with_hifigan开源文本转语音模型

首页

Fastspeech2 Conformer With Hifigan

由 espnet 开发

整合FastSpeech2Conformer与HiFi-GAN的文本转语音模型，提供高效高质量的语音合成

语音合成

Transformers

英语开源协议:Apache-2.0 #非自回归TTS #Conformer架构 #HiFi-GAN声码器

下载量 635

发布时间 : 7/20/2023

模型简介

本模型将FastSpeech2Conformer文本转语音模型与HiFi-GAN声码器整合为单一模型，能够直接从文本生成高质量语音波形

模型特点

非自回归架构

采用FastSpeech2的非自回归结构，实现快速语音合成

高质量语音输出

结合Conformer架构和HiFi-GAN声码器，生成自然流畅的语音波形

端到端整合

将文本到梅尔频谱图和梅尔频谱图到波形的过程整合为单一模型

模型能力

文本转语音

高质量语音合成

快速语音生成

使用案例

语音合成应用

语音助手

为智能助手提供自然语音输出

生成自然流畅的语音响应

有声读物

将文本内容自动转换为语音

高效生成高质量的朗读语音

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Fastspeech2 Conformer With Hifigan

模型简介

模型特点

模型能力

使用案例

🚀 FastSpeech2ConformerWithHifiGan

🚀 快速开始

📦 安装指南

💻 使用示例

基础用法

📄 许可证