K

Kokorotts

由 Daemontatox 开发
Kokoro是一款拥有8200万参数的开源文本转语音模型,以轻量架构提供媲美大型模型的音质,同时显著提升速度和成本效益。
下载量 78
发布时间 : 2/27/2025
模型介绍
内容详情
替代品

模型简介

Kokoro是基于StyleTTS2架构的多语言文本转语音模型,支持8种语言和54种音色,适用于从生产环境到个人项目的各种部署场景。

模型特点

轻量高效
仅8200万参数的轻量架构,却能提供与大型模型相媲美的音质
多语言支持
支持8种语言和54种音色,满足多样化需求
开源许可
采用Apache-2.0许可,可自由部署于商业和个人项目
低成本训练
仅需1000美元训练成本(1000 A100 GPU小时)

模型能力

高质量文本转语音
多语言语音合成
音色切换
语速调节

使用案例

内容创作
有声读物生成
将文字内容转换为自然语音
支持多种语言和音色选择
辅助技术
语音辅助应用
为视障用户提供语音输出功能
轻量模型适合移动端部署
教育
语言学习工具
生成多语言发音示范
支持8种语言的准确发音