S

SARA TTS

由 BHOSAI 开发
巴库高等石油学校人工智能研发中心与PRODATA合作推出的阿塞拜疆语文本转语音模型,基于VITS架构并参考Meta MMS模型。
下载量 173
发布时间 : 7/30/2024
模型介绍
内容详情
替代品

模型简介

该模型专注于阿塞拜疆语的文本转语音任务,通过改进输入标记的稳健性来提升语音自然度和语调稳定性。

模型特点

改进的稳健性
通过优化输入标记处理,解决了原Meta MMS模型对输入标记变化敏感的问题,使语调更加稳定。
高质量语音合成
基于VITS架构,能够生成自然度较高的阿塞拜疆语语音。
数据增强
通过组合2-3个句子生成连贯的输入语音,提升了模型的上下文处理能力。

模型能力

阿塞拜疆语文本转语音
自然语音合成

使用案例

语音助手
阿塞拜疆语语音助手
为阿塞拜疆语用户提供本地化的语音交互体验。
生成自然流畅的阿塞拜疆语语音响应
教育科技
语言学习工具
帮助学习者练习阿塞拜疆语发音和听力。
提供准确的阿塞拜疆语发音示范