kan-bayashi_ljspeech_vits开源文本转语音模型

首页

Kan Bayashi Ljspeech Vits

由 espnet 开发

基于ESPnet框架训练的VITS文本转语音模型，使用LJSpeech数据集训练，支持英语语音合成。

语音合成英语#高质量语音合成 #端到端TTS #VITS架构

下载量 2,780

发布时间 : 3/2/2022

模型简介

该模型是一个端到端的文本转语音(TTS)模型，采用VITS架构，能够将英文文本转换为自然语音。

模型特点

端到端语音合成

采用VITS架构实现端到端的文本到语音转换，无需复杂的特征工程

高质量语音输出

基于LJSpeech数据集训练，可生成自然流畅的英语语音

ESPnet集成

完全兼容ESPnet生态系统，便于部署和集成

模型能力

英语文本转语音

高质量语音合成

使用案例

语音合成应用

有声读物生成

将电子书文本自动转换为语音

生成自然流畅的有声读物

语音助手

为智能助手提供语音输出能力

提升用户体验的自然语音交互

🚀 ESPnet2 TTS预训练模型

这是一个基于ESPnet的文本转语音（TTS）预训练模型，可用于音频处理相关任务，能有效实现文本到语音的转换。

🚀 快速开始

模型信息

模型名称：kan-bayashi/ljspeech_vits
导入来源：♻️ 从 https://zenodo.org/record/5443814/ 导入
训练者：kan-bayashi
训练使用的数据集：ljspeech
训练使用的配方：ljspeech/tts1 配方，来自 espnet

许可证

本模型使用的许可证为 CC BY 4.0。

演示：在ESPnet2中的使用方法

# coming soon

引用ESPnet

如果你在研究中使用了ESPnet，可以按照以下格式进行引用：

Interspeech会议论文引用

@inproceedings{watanabe2018espnet,
  author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson {Enrique Yalta Soplin} and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
  title={{ESPnet}: End-to-End Speech Processing Toolkit},
  year={2018},
  booktitle={Proceedings of Interspeech},
  pages={2207--2211},
  doi={10.21437/Interspeech.2018-1456},
  url={http://dx.doi.org/10.21437/Interspeech.2018-1456}
}
@inproceedings{hayashi2020espnet,
  title={{Espnet-TTS}: Unified, reproducible, and integratable open source end-to-end text-to-speech toolkit},
  author={Hayashi, Tomoki and Yamamoto, Ryuichi and Inoue, Katsuki and Yoshimura, Takenori and Watanabe, Shinji and Toda, Tomoki and Takeda, Kazuya and Zhang, Yu and Tan, Xu},
  booktitle={Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)},
  pages={7654--7658},
  year={2020},
  organization={IEEE}
}

arXiv预印本引用

@misc{watanabe2018espnet,
      title={ESPnet: End-to-End Speech Processing Toolkit}, 
      author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Enrique Yalta Soplin and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
      year={2018},
      eprint={1804.00015},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}