K

Kotoba Speech V0.1

由 kotoba-tech 开发
Kotoba-Speech v0.1 是一个基于12亿参数Transformer的日语语音生成模型,支持文本转语音和单样本语音克隆。
下载量 23
发布时间 : 3/14/2024

模型简介

该模型是一个端到端的Transformer架构语音生成模型,专注于日语文本转语音和语音克隆功能。

模型特点

流畅的日语语音生成
能够将日语文本流畅地转换为自然语音
单样本语音克隆
通过语音提示实现仅需一个样本的语音克隆功能
大参数规模
基于12亿参数的Transformer架构,提供高质量的语音生成

模型能力

日语文本转语音
语音克隆
语音合成

使用案例

语音交互
语音助手
为日语语音助手提供自然流畅的语音输出
提升用户体验的自然度
内容创作
有声读物生成
将日语文本自动转换为有声读物
高效生成高质量的语音内容
个性化服务
个性化语音克隆
通过少量样本克隆特定人物的语音
实现个性化的语音服务
AIbase
智启未来,您的人工智能解决方案智库
简体中文