F

F5 TTS Vietnamese 100h

由 hynt 开发
基于F5-TTS微调的紧凑版本,训练数据为150小时的越南语语音,仅限研究用途。
下载量 123
发布时间 : 3/23/2025
模型介绍
内容详情
替代品

模型简介

这是一个针对越南语优化的文本转语音(TTS)模型,基于F5-TTS架构微调,适用于越南语语音合成任务。

模型特点

高质量越南语语音合成
使用150小时精选越南语语音数据训练,提供高质量的语音合成效果
严格的数据处理
使用demucs去除背景音乐,过滤短于1秒或长于30秒的音频,保证数据质量
学术合作数据集
包含VLSP系列数据集和UEH大学提供的50小时高质量标注数据

模型能力

越南语文本转语音
语音合成
语音克隆(通过参考音频)

使用案例

学术研究
越南语语音合成研究
用于语音合成技术的研究和实验
教育应用
越南语学习辅助
为越南语学习者提供发音参考