K

Kokoro

由 geneing 开发
Kokoro 是一款前沿的文本转语音(TTS)模型,参数量为8200万,采用Apache 2.0许可证发布。在TTS Spaces Arena中排名第一,以更少的参数和数据获得更高的Elo评分。
下载量 37
发布时间 : 1/1/2025
模型介绍
内容详情
替代品

模型简介

Kokoro是一款高性能的文本转语音模型,支持美式和英式英语,能够生成高质量的语音输出。

模型特点

高效参数利用
以8200万参数和少于100小时的训练数据,在TTS Spaces Arena中排名第一,展示了高效的参数利用能力。
多语音支持
提供10个独特的语音包,支持不同的语音风格和口音。
开源许可证
采用Apache 2.0许可证,允许自由使用和修改。

模型能力

文本转语音
支持多语音包
高质量语音生成

使用案例

语音合成
语音助手
用于生成语音助手的自然语音响应。
高质量的语音输出,接近真人发音。
有声读物
将文本内容转换为语音,用于制作有声读物。
流畅的语音输出,适合长时间聆听。