E

Erax Smile UnixSex F5

由 erax-ai 开发
基于F5-TTS架构的越南语文本转语音模型,支持中性风格语音克隆
下载量 120
发布时间 : 4/18/2025
模型介绍
内容详情
替代品

模型简介

这是一个基于F5-TTS架构的越南语文本转语音模型,经过超过2,700,000个越南语样本的微调,支持中性风格语音克隆和零样本语音克隆功能。

模型特点

越南语支持
专门针对越南语优化,使用大量越南语样本进行训练
语音克隆
支持零样本语音克隆功能,可根据参考音频生成相似语音
多风格支持
支持女声、男声和中性风格的语音生成
开源代码
提供完整的开源实现代码,便于研究和二次开发

模型能力

越南语文本转语音
语音风格克隆
中性语音生成
多风格语音合成

使用案例

语音合成
新闻播报
生成自然流畅的越南语新闻播报语音
可参考模型页面提供的音频样本
有声读物
为越南语电子书生成朗读语音
语音克隆
个性化语音助手
克隆特定人物的语音创建个性化语音助手