K

Kokoro 82M Light

由 ctranslate2-4you 开发
基于StyleTTS2-LJSpeech的克隆版本,针对英语文本转语音任务进行了优化,移除了部分依赖项以简化部署。
下载量 21
发布时间 : 1/28/2025
模型介绍
内容详情
替代品

模型简介

这是一个文本转语音(TTS)模型,专注于生成高质量的英语语音输出。相比原始版本,本仓库移除了部分依赖项,简化了安装和使用流程。

模型特点

精简依赖项
移除了munch和phonemizer依赖项,改为直接调用espeak,显著减少了依赖项数量
英语发音优化
添加了expand_acronym()函数以改善特定词汇(如NASA)的发音
轻量级部署
相比v1.0版本减少了约80个依赖项,在保持98%质量的同时简化了部署

模型能力

英语文本转语音
英式英语语音合成
缩写词发音优化

使用案例

语音合成
有声读物生成
将英文文本转换为自然语音,用于有声读物制作
生成接近人类发音的语音输出
语音助手
为英语语音助手提供语音合成能力
流畅自然的英语语音响应