E

Epxtts

由 epchannel 开发
viⓍTTS 是一款语音生成模型,能够通过6秒的简短音频片段克隆声音到不同语言中。
下载量 22
发布时间 : 4/4/2025
模型介绍
内容详情
替代品

模型简介

基于 XTTS-v2.0.3 模型微调,扩展了越南语支持并在 viVoice 数据集上训练,支持18种语言的语音生成。

模型特点

多语言支持
支持18种语言的语音生成,包括越南语、英语、中文等。
声音克隆
只需6秒的音频片段即可克隆声音到不同语言中。
越南语优化
专门针对越南语进行了分词器扩展和数据集训练。

模型能力

文本转语音
多语言语音生成
声音克隆

使用案例

语音合成
多语言语音助手
为不同语言的用户提供个性化的语音交互体验。
有声内容创作
快速生成不同语言的配音内容。