F

Fastspeech2 En 200 Speaker Cv4

由 facebook 开发
基于FastSpeech 2架构的英语文本转语音模型,支持200种不同声音,基于Common Voice v4数据集训练。
下载量 37
发布时间 : 3/2/2022

模型简介

这是一个多说话人文本转语音模型,能够将英语文本转换为自然语音,支持200种不同的男声和女声。

模型特点

多说话人支持
模型支持200种不同的男声和女声,可在使用时随机选择说话人。
高质量语音合成
基于FastSpeech 2架构,能够生成自然流畅的语音输出。
大规模数据集训练
使用Common Voice v4数据集进行训练,保证了模型的泛化能力。

模型能力

英语文本转语音
多说话人语音合成

使用案例

语音合成应用
语音助手
为语音助手系统提供自然的多声音语音输出。
生成自然流畅的语音响应
有声读物
将文本内容自动转换为多种声音的有声读物。
支持200种不同声音的朗读
AIbase
智启未来,您的人工智能解决方案智库
简体中文