X

XTTS V1

由 coqui 开发
ⓍTTS 是一款语音生成模型,仅需6秒的音频片段即可克隆声音并应用于不同语言。
下载量 5,449
发布时间 : 9/13/2023
模型介绍
内容详情
替代品

模型简介

基于Tortoise架构的跨语言语音克隆与生成模型,支持14种语言,可实现情感与风格迁移。

模型特点

快速声音克隆
仅需6秒音频即可克隆目标声音特征
跨语言支持
支持14种语言的语音生成与跨语言克隆
情感迁移
可保留原始音频的情感与风格特征
高质量输出
24kHz采样率生成自然语音

模型能力

文本转语音
语音克隆
跨语言语音生成
情感风格迁移

使用案例

内容创作
多语言有声内容生成
为视频、播客等内容快速生成多语言配音
保持统一声音特征的同时支持多种语言输出
辅助技术
语音辅助工具
为语言障碍者创建个性化语音输出
使用少量样本即可还原用户原有声音特征