Kotoba-Speech v0.1开源日语语音生成模型 - 支持文本转语音与单样本语音克隆

首页

Kotoba Speech V0.1

由 kotoba-tech 开发

Kotoba-Speech v0.1 是一个基于12亿参数Transformer的日语语音生成模型，支持文本转语音和单样本语音克隆。

语音合成

Transformers

日语开源协议:Apache-2.0 #日语TTS #语音克隆 #12亿参数

下载量 23

发布时间 : 3/14/2024

模型简介

该模型是一个端到端的Transformer架构语音生成模型，专注于日语文本转语音和语音克隆功能。

模型特点

流畅的日语语音生成

能够将日语文本流畅地转换为自然语音

单样本语音克隆

通过语音提示实现仅需一个样本的语音克隆功能

大参数规模

基于12亿参数的Transformer架构，提供高质量的语音生成

模型能力

日语文本转语音

语音克隆

语音合成

使用案例

语音交互

语音助手

为日语语音助手提供自然流畅的语音输出

提升用户体验的自然度

内容创作

有声读物生成

将日语文本自动转换为有声读物

高效生成高质量的语音内容

个性化服务

个性化语音克隆

通过少量样本克隆特定人物的语音

实现个性化的语音服务

属性	详情
模型类型	我们的模型是端到端的Transformer模型。
支持语言	日语
依赖库	我们将很快发布训练代码。推理和模型代码主要借鉴自metavoice。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Kotoba Speech V0.1

模型简介

模型特点

模型能力

使用案例

🚀 Kotoba-Speech-v0.1

🚀 快速开始

✨ 主要特性

📚 详细文档

📄 许可证

🙏 致谢