K

Kokoro 82M

由 hexgrad 开发
Kokoro是一款拥有8200万参数的开源文本转语音(TTS)模型,以其轻量级架构和高音质著称,同时具备快速和成本效益高的特点。
下载量 2.0M
发布时间 : 12/26/2024
模型介绍
内容详情
替代品

模型简介

Kokoro是一款基于Apache许可的文本转语音模型,能够生成高质量的语音输出,适用于从生产环境到个人项目的各种场景。

模型特点

轻量级架构
尽管参数规模较小,但能提供与大型模型相媲美的音质。
高效成本
每百万字符文本输入低于1美元,每小时音频输出低于0.06美元。
多语言支持
支持8种语言和54种音色,适用于多样化的应用场景。
开源许可
采用Apache许可,允许自由部署于商业和个人项目。

模型能力

文本转语音
多语言语音合成
高效音频生成

使用案例

商业应用
语音助手
为商业应用提供高质量的语音输出。
高效且成本低廉的语音合成方案。
有声读物
生成自然流畅的有声读物内容。
高质量的多语言语音输出。
个人项目
个人语音助手
为个人项目提供定制化的语音输出。
轻量级且易于部署的解决方案。