K

Kokoro 82M

由 prince-canuma 开发
Kokoro是一款拥有8200万参数的开源TTS模型,音质媲美更大模型,同时具备显著的速度优势和成本效益。
下载量 376
发布时间 : 2/26/2025
模型介绍
内容详情
替代品

模型简介

Kokoro是一款轻量级文本转语音模型,基于StyleTTS2架构,支持多种语言和音色,适用于生产环境和个人项目。

模型特点

轻量高效
8200万参数的轻量架构,在保持高质量音质的同时具备快速推理能力
多语言支持
支持8种语言和54种音色,满足多样化需求
开源许可
采用Apache-2.0许可证,可自由用于商业和个人项目
低成本训练
仅需1000美元训练成本,使用A100 GPU完成训练

模型能力

高质量语音合成
多语言语音生成
音色切换
语速调节

使用案例

内容创作
有声读物生成
将文本内容转换为自然语音
生成高质量、富有表现力的语音
视频配音
为视频内容添加多语言配音
支持多种语言和音色的语音输出
辅助技术
语音辅助应用
为视障用户提供文本朗读功能
生成清晰自然的语音输出