M

Matxa Tts Cat Multispeaker

由 projecte-aina 开发
基于Matcha-TTS架构的加泰罗尼亚语多说话人文本转语音模型,通过最优传输条件流匹配训练,支持快速高质量语音合成
下载量 21
发布时间 : 3/28/2024
模型介绍
内容详情
替代品

模型简介

Matxa-TTS是一种非自回归的文本转语音模型,专为加泰罗尼亚语设计,支持多说话人语音合成。它采用编码器-解码器架构,结合最优传输条件流匹配训练方法,能以较少的合成步骤生成高质量语音输出。

模型特点

多说话人支持
支持47个加泰罗尼亚语说话人的语音合成
快速高质量合成
采用最优传输条件流匹配训练,能以较少的合成步骤生成高质量语音
高效架构
基于Transformer的U-Net解码器结构,使用1D CNN降低内存消耗并提高合成速度
语言特定优化
使用加泰罗尼亚语音素器和专用数据集进行微调,优化本地语言支持

模型能力

加泰罗尼亚语文本转语音
多说话人语音合成
可调节语速和生成温度
高质量语音输出

使用案例

语音合成应用
语音助手
为加泰罗尼亚语语音助手提供自然语音输出
支持多种说话人声音选择
有声读物
将加泰罗尼亚语文本转换为自然语音
可根据需要调整语速和语调
辅助技术
为视障人士提供加泰罗尼亚语文本朗读功能
支持多种声音选择以满足个人偏好